xml.etree.ElementTree.parse在我的xhtml文件上窒息。我看到了lxml可以处理html的地方。有人可以告诉我解析,然后改变XHTML的文件化的方式吗?我想随时添加一些javascript到xhtml。在Python 2.6中解析xhtml
1
A
回答
3
您试过BeautifulSoup?它处理那些格式不正确的文档,我发现它很不错。
+0
还没有尝试过。你有解析xhtml吗? – Alex 2010-02-26 00:02:35
+0
是的 - 我在一个XHTML网站的数据提取器中使用,它似乎管理得很好。我不确定使用BeautifulSoup编辑文档是多么容易,因为我只对提取感兴趣,但它会处理提取部分。 – 2010-02-26 00:15:45
相关问题
- 1. 的Python 2.6 - 解析参数
- 2. 使用Python 3.2解析XHTML
- 3. 解析JSON从Python中的URL 2.6
- 4. python 2.6中的xml解析错误
- 5. Python 2.6:与urllib2并行解析
- 6. 解析Objective-C中的XHTML
- 7. 在iPhone SDK解析xhtml?
- 8. iPhone解析xhtml + css
- 9. 使用xml.etree.ElementTree解析XHTML
- 10. 使用Ruby解析XHTML
- 11. 使用HTMLAgilityPack解析XHTML
- 12. 如何Android的XHTML解析
- 13. 解析来自电子邮件的日期时间在Python 2.6
- 14. 在Windows 2.6的Python 2.6中安装bitarray
- 15. Java - XHTML文档中的SAX解析器
- 16. “virtualenv-3.4”在Python 2.6中?
- 17. multiprocessing.Pool.imap_unordered在Python 2.6中挂起?
- 18. 在Python 2.6中使用JSON?
- 19. 解析/ Python中
- 20. 解析在python
- 21. 解析在Python
- 22. 解析在python
- 23. 解析在Python
- 24. 用python 2.6导入numpy 2.6
- 25. 访问在Python 2.6
- 26. 使用DocumentBuilder解析XHTML时出现无限循环“解析”
- 27. Java和xpath - xHtml解析问题
- 28. 使用SAX解析XHTML只更改PCDATA
- 29. dom4j XPath不工作解析xhtml文档
- 30. 如何使用DOM解析器解析xhtml忽略DOCTYPE声明
什么是'窒息'?文档不是格式良好的XML吗?它是否使用非DTD阅读解析器无法解决的特定于HTML的实体? – bobince 2010-02-26 00:56:49
通过“窒息”我的意思是,当我试图分析我的XHTML文件是这样的: HTML = myElementTree.parse(myXHTMLFile) 的应用程序会引发以下异常: 未定义的实体 :行16,列164 我以前遇到过其他语言。正如你所建议的那样, 是html中的有效字符,但不是xml。 – Alex 2010-03-02 23:15:12