我试图解析http://www.ted.com/talks页会谈的所有名称。使用BeautifulSoup,这里是我有:故障排除AttributeError的:“结果集”对象有没有属性“的findAll”
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen("http://www.ted.com/talks")
soup = BeautifulSoup(page)
link = soup.findAll(lambda tag: tag.name == 'a' and tag.findParent('dt', 'thumbnail'))
for anchor in link.findAll('a', title = True):
print anchor['title']
最初的“链接”显示八个视频有块的一个很好的阵列。然后,我尝试通过这个并拿出标签中的标题,使用上面的代码,这给了我以下错误:
for anchor in link.findAll('a', title=True):
AttributeError: 'ResultSet' object has no attribute 'findAll'
我在做什么错?
这提供了以下错误:打印[ '标题' ] NameError:名称 'A' 没有定义 – EGP 2011-04-26 22:41:31
@Adam遗憾,这是一个错字。现在修复。 – interjay 2011-04-26 22:42:53
看起来很迷人。谢谢!了解我可以在哪里了解更多关于'锚'的语法?举例来说:假设我想要的
而不是标签。我只想改变的findAll(“IMG”?只是好奇,了解更多信息。 –
EGP
2011-04-26 23:55:40