我正在寻找一个像HtmlAgilityPack(开源.NET项目:http://www.codeplex.com/htmlagilitypack)的好解析器,但是适用于Python。是否有像HtmlAgilityPack(.NET)for Python这样的好解析器?
任何人都知道吗?
我正在寻找一个像HtmlAgilityPack(开源.NET项目:http://www.codeplex.com/htmlagilitypack)的好解析器,但是适用于Python。是否有像HtmlAgilityPack(.NET)for Python这样的好解析器?
任何人都知道吗?
使用Beautiful Soup像大家一样。
Beautiful Soup应该是你要搜索的东西。它是一个html/xml解析器,可以处理无效页面并允许遍历特定标签。
lxml比BS更好地处理无效页面。使用lxml.html中的css选择器遍历标签更容易。 – aehlke 2009-08-03 20:35:53
此时BS已经成功了lxml。 – aehlke 2009-08-03 20:35:18