2013-05-28 69 views
1

我想从网页中抓取嵌套在div标签中的一些数据。从div标签提取数据Python

url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html' 
boxurl = urllib2.urlopen(url).read() 
soup = BeautifulSoup(boxurl) 

linescoreA = soup.find("div", {"class": "scoreA"}) 

print linescoreA 

输出这样的:

<div class="scoreA"> 
<div class="period">19</div> 
<div class="period">22</div> 
<div class="period">22</div><div class="period">26</div> 
<div class="final">89</div> 
<div class="clear"></div> 
</div> 

,这是我卡住。我如何从div标签获取数据?

回答

2

得到公正的文本数据,使用.stripped_strings

print list(linescoreA.stripped_strings) 
+0

感谢,它似乎应该是eazy – user2333196

1

尝试

for node in soup.find("div", {"class": "scoreA"}): 
    print ''.join(node.findAll(text=True)) 

和什么有关

for node in soup.find("div", {"class": "scoreA"}): 
     print node.string 

我很抱歉,我不能尝试为您服务。

+0

这种方式适用于标题标签,而上述不适用。 – user2333196