2010-05-28 44 views
0

我想创建一个目录,其中包含从RSS源中收集的新闻文章,这意味着无论何时链接到RSS源中的文章,我都希望将其下载到具有特定文章标题作为文件名的目录作为文本文件。 Python可以帮助我做些什么吗?从rss源中的链接下载

谢谢你的帮助:-)

回答

2

您可以使用feedparser解析RSS提要并使用urllib2下载文件。如果您需要解析HTML,请使用BeautifulSoup。如果您遇到任何问题,请发布更具体的问题。

+1

feedparser链接已死亡。更新。 – kmonsoor 2014-04-11 13:57:41

1

当然。 BeautifulSoup,lxml,urllib2,urlgrabber。