从div标签提取数据Python

我想从网页中抓取嵌套在div标签中的一些数据。从div标签提取数据Python

url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html' 
boxurl = urllib2.urlopen(url).read() 
soup = BeautifulSoup(boxurl) 

linescoreA = soup.find("div", {"class": "scoreA"}) 

print linescoreA

输出这样的：

<div class="scoreA"> 
<div class="period">19</div> 
<div class="period">22</div> 
<div class="period">22</div><div class="period">26</div> 
<div class="final">89</div> 
<div class="clear"></div> 
</div>

，这是我卡住。我如何从div标签获取数据？

来源

2013-05-28 user2333196

得到公正的文本数据，使用.stripped_strings：

print list(linescoreA.stripped_strings)

来源

2013-05-28 18:09:04

感谢，它似乎应该是eazy – user2333196

尝试

for node in soup.find("div", {"class": "scoreA"}): 
    print ''.join(node.findAll(text=True))

和什么有关

for node in soup.find("div", {"class": "scoreA"}): 
     print node.string

我很抱歉，我不能尝试为您服务。

来源

2013-05-28 18:20:23 octoback

这种方式适用于标题标签，而上述不适用。 – user2333196

从div标签提取数据Python

回答

相关问题