2011-04-07 49 views
1

我正在尝试构建一个博客映射网站,它可以查看给定博客集中的当前趋势。为了方便起见,我将重点介绍给定的WordPress博客列表。Python:解析wordpress HTML

是否有解析Wordpress HTML的Python包?

我在寻找:

  • 识别(是给定一个HTML WordPress的博客)
  • 博客属性(名称,职位,RSS链接,博客链接...)
  • 邮政属性(标题,文字,标签...)

如果没有这样的软件包,我可以将它自己作为开源项目来实现,但现有的软件包会为我节省大量时间。

+1

如果你写自己的,看看[美丽的汤](http://www.crummy.com/software/BeautifulSoup/) – nmichaels 2011-04-07 21:13:50

+0

我建议lxml更现代 – Guard 2011-04-07 22:41:59

回答