我试图用xml.dom.minidom解析一个ODF文档。我想获得所有文本元素:p或者text:h。似乎有一种方法可以在getElementsByTagName方法中添加通配符。或者是?getElementsByTagName中的通配符(xml.dom.minidom)
有没有更好的方式来解析没有uno的odf文件?
我试图用xml.dom.minidom解析一个ODF文档。我想获得所有文本元素:p或者text:h。似乎有一种方法可以在getElementsByTagName方法中添加通配符。或者是?getElementsByTagName中的通配符(xml.dom.minidom)
有没有更好的方式来解析没有uno的odf文件?
由于getElementsByTagName返回一个DOMElement列表,你可以简单地连接这两个列表。
或者XPath支持and/or
运算符,所以你可以使用它。这需要使用elementTree
或lxml
模块。
root_element.getElementsByTagNameNS('text', '*')
也许把?
而不是*
这为我工作,但周围的其他方法
<325t4342:Key> fooo </.....>...
key = (root_element.getElementsByTagNameNS('*', "Key")[0]).firstChild.data.strip()
给我“富”
但我需要他们在同如树中所示。如果我把它们集中起来,正确的顺序将会丢失。这让我去尝试其他库? –
假设文本之间存在一对一映射:p和text:h您可以使用python zip函数创建元组列表,以便元组将包含相应的元素text:h和text:p元素。 –
好的。我宁愿尝试lxml,我认为... :) Thnx –