2014-03-05 31 views
0

我好像刮表被卡住,如果我下面的表有:与beautifulsoup

<table align=center cellpadding=3 cellspacing=0 border=1> 
<tr bgcolor="#EEEEFF"> 
    <td align="center"> 
    40 </td> 
    <td align="center"> 
    44 </td> 
    <td align="center"> 
    <font color="green"><b>+4</b></font> 
    </td> 
    <td align="center"> 
    1,000</td> 
    <td align="center"> 
    15,000 </td> 
    <td align="center"> 
    44,000 </td> 
    <td align="center"> 
    <font color="green"><b><nobr>+193.33%</nobr></b></font> 
    </td> 

</tr> 

什么是使用find_all拉从表中的4.4万名TD的理想方式?

+1

“44,000”表格单元与其他单元格有什么区别?为什么具体的价值? –

回答

1

如果它是一个反复出现的表格,你想刮,你想刮,我会用美丽的汤提取表中的所有元素,然后提取该数据。请参阅下面的伪代码。

known_position = 5 
tds = bs4.find_all('td') 
number = tds[known_position].text() 

另一方面,如果你正在寻找一个给定的数字,我只是遍历列表。

tds = bs4.find_all('td') 
for td in tds: 
    if td.text = 'number here': 
     # do your stuff