2012-05-02 74 views

回答

11

所有子元素的elem(后代):

all_descendants = list(elem.iter()) 

一个更完整的例子:

>>> import xml.etree.ElementTree as ET 
>>> a = ET.Element('a') 
>>> b = ET.SubElement(a, 'b') 
>>> c = ET.SubElement(a, 'c') 
>>> d = ET.SubElement(a, 'd') 
>>> e = ET.SubElement(b, 'e') 
>>> f = ET.SubElement(d, 'f') 
>>> g = ET.SubElement(d, 'g') 
>>> [elem.tag for elem in a.iter()] 
['a', 'b', 'e', 'c', 'd', 'f', 'g'] 

要排除根目录本身:

>>> [elem.tag for elem in a.iter() if elem is not a] 
['b', 'e', 'c', 'd', 'f', 'g'] 
+1

对不起礼,但也许我没有让自己明白,我只是想获得所有的子元素,而不是根。即在这里根不需要。但我认为你的方法也包含根对象,对吧? – j5shi

+0

@Steven:查看更新 –

+1

但是如果元素'a'中嵌套了多个标签'a'并且我想要获取所有'a'结构的所有子元素? – j5shi

2

如果你想获取所有元素'a',您可以使用:

a_lst = list(elem.iter('a')) 

如果elem也是“a”,它将被包括在内。

1

现有的答案都不会找到所有的孩子。该解决方案使用BeautifulSoup代替ETree,但会发现所有的孩子,而不是仅仅顶级:

from bs4 import BeautifulSoup  

with open(filename) as f: 
    soup = BeautifulSoup(f, 'xml') 

results = soup.find_all('element_name') 
相关问题