2017-05-16 114 views
0

东西在一个HTML字符串我有一个HTML字符串,其内容如下:搜索通过Python

  <div class="icon-box"> 
    <div class="result"></div> 
    <div class="count">#1244587 - 16</div> 
    </div> 

这种模式重复数百次只,从逻辑上讲,其他号码。第一个/左边的数字总是有相同数量的数字,第二个/右边的数字有一个或两个数字。

现在我需要两个数字分别在tabel中。每个都在一个单独的列中。我试图用re.search/re.findall来做到这一点,但我遇到了'<'和'#'的问题。

回答

0

我使用split()来搜索那样的字符串。隔离第三行则

thirdline.split(">")[1] 

获得“#1244587 - 16 ...”,然后因为你知道,左侧的数字总是有7个数字,你可以采取的字符串,字符串做[1:7]得到左边的号码。然后做

string[11:len(string)].split("<") 

摆脱最后的“<”。然后,您可以将它们转换为浮点数并将它们追加到列表中,以制作一张表格。