beautifulsoup：解析跨度标题

我想解析一个html页面，我已经成功地到了HTML DOM的树的子区域，但我卡在一个有span标签的地方。beautifulsoup：解析跨度标题

例如：我最初解析页面如下：

 user_url = base_url + str(user_id) + "/" + display_name 
     user_page = urllib2.urlopen(user_url) 
     souping_page = bs(user_page) 
     badges = souping_page.body.find('div', attrs={'class': 'badges'})

徽章给我以下内容：

<span><span title="3 gold badges"><span class="badge1"></span><span class="badgecount">3</span></span><span title="23 silver badges"><span class="badge2"></span><span class="badgecount">23</span></span><span title="43 bronze badges"><span class="badge3"></span><span class="badgecount">43</span></span></span>

但我通过遍历试图提取<span title="3 gold badges">和所有其他span title属性dom结构。我怎么能在美丽的脸上做到这一点。

来源

2014-03-02 Null-Hypothesis

你可以简单地这样做：

>>> badges.span.span 
<span title="3 gold badges"><span class="badge1"></span><span class="badgecount">3</span></span>

来源

2014-03-02 00:32:21 aIKid

@alKid看起来像它缺少'<跨度标题= “23个银徽章”>' –

beautifulsoup：解析跨度标题

回答

相关问题