0
我想解析使用Python的XML文件。由于XML的大小,我想使用Pull Parser。我找到了this之一。Python的XML解析器
我的代码开始与
doc = pulldom.parse("myfile.xml")
for event, node in doc:
# code here...
我使用
if (node.localName == "b"):
获取XML标签名,并能正常工作。
我无法找到如何做是从标签之间获取文本。使用node.nodeValue
返回None
。
我可以使用node.toxml()
来获取节点的完整XML,但我只想要标记之间的文本。有没有办法做到这一点,而不是使用正则表达式替换从node.toxml()
中取出标签?
'ElementTree' API提供了一个流式变体(标准库和'lxml'实现了它)。你可能想看看,并使用结束事件来获取文本。 –
如果你可以切换到'ElementTree'看看这个http://blog.doughellmann.com/2010/03/pymotw-parsing-xml-documents-with.html。它解决了你的问题 – Netro