2010-07-20 26 views
1

的Python美丽的汤标签为表TD的Python美丽的汤标签为表TD

<td class="result" valign="top" colspan="3"> 

目前,以下不工作:

​​

四处错误:

HTMLParser.HTMLParseError: malformed start tag 
+0

你的汤是由一个完整的html页面,或只是你的td线? – 2010-07-20 12:53:05

+0

它的整个页面,以及td的列表 – bobsr 2010-07-20 13:04:24

回答

1

正如website所述,HTMLParser是quitefragile。您应该使用SGMLParser,因为它对于格式错误的HTML更强大。

不幸的是,Python 3.0已经从标准库中删除了SGMLParser。有关建议的解决方法,请参阅上面的链接,例如使用html5lib