1
我正在尝试构建一个博客映射网站,它可以查看给定博客集中的当前趋势。为了方便起见,我将重点介绍给定的WordPress博客列表。Python:解析wordpress HTML
是否有解析Wordpress HTML的Python包?
我在寻找:
- 识别(是给定一个HTML WordPress的博客)
- 博客属性(名称,职位,RSS链接,博客链接...)
- 邮政属性(标题,文字,标签...)
如果没有这样的软件包,我可以将它自己作为开源项目来实现,但现有的软件包会为我节省大量时间。
如果你写自己的,看看[美丽的汤](http://www.crummy.com/software/BeautifulSoup/) – nmichaels 2011-04-07 21:13:50
我建议lxml更现代 – Guard 2011-04-07 22:41:59