2017-09-02 41 views
2

我有一个内存蟒XML ElementTree的看起来像如何以xml节点的有序方式序列化python ElementTree?

<A> 
    <B>..</B> 
    <C>..</C> 
    <D>..</D> 
</A> 

我序列ElementTree的成XML通过

xmlstr = minidom.parseString(ET.tostring(root)).toprettyxml(" ") 

内节点B的顺序,C,d的每一次变化我调用上面的tostring()方法。我怎样才能确保我的序列化将遵循确定性的顺序?

+3

无法重现。请提供[mcve]。 –

回答

0

我知道很多答案在这里建议这一点,但

minidom.parseString(ET.tostring(root)).toprettyxml(" ") 

实际上是非常印刷XML文件真正可怕的方式。

它涉及到解析,与ET序列化,然后再解析,并用完全不同的XML库再次序列化。这很愚蠢和浪费,如果迷你游戏机弄乱了它,我不会感到惊讶。

如果你安装了它,切换到lxml and use its built-in pretty-printing function

如果您由于某种原因套牢xml.etree.ElementTree,你可以用一个简单的递归函数来美化树就地:

# xmlhelpers.py 

# taken from http://effbot.org/zone/element-lib.htm#prettyprint 
def indent(elem, level=0): 
    i = "\n" + level*" " 
    if len(elem): 
     if not elem.text or not elem.text.strip(): 
      elem.text = i + " " 
     if not elem.tail or not elem.tail.strip(): 
      elem.tail = i 
     for elem in elem: 
      indent(elem, level+1) 
     if not elem.tail or not elem.tail.strip(): 
      elem.tail = i 
    else: 
     if level and (not elem.tail or not elem.tail.strip()): 
      elem.tail = i 

用法是直截了当:

import xml.etree.ElementTree as ET 
from xmlhelpers import indent  

root = ET.fromstring("<A><B>..</B><C>..</C><D>..</D></A>") 
indent(root) 

print(ET.tostring(root)) 

此打印很好地缩进版本:

b'<A>\n <B>..</B>\n <C>..</C>\n <D>..</D>\n</A>\n' 

话虽这么说,从未使用“的toString”写XML树到一个文件中。

始终使用XML库提供的函数编写XML文件。

tree = ET.ElementTree(root) # only necessary if you don't already have a tree 
tree.write(filename, encoding="UTF-8") 
相关问题