2011-05-30 11 views
0

我有一个XML文件,在其中有可能会发生以下情况:如何使用python的lxml.etree库从一个xml标签的所有嵌套标签中获取所有字符串?

... 
<a><b>This is</b> some text about <c>some</c> issue I have, parsing xml</a> 
... 

编辑:让我们假设,该标签可以被嵌套不仅仅是水平以上,这意味着

<a><b><c>...</c>...</b>...</a> 

我想出了与此使用python lxml.etree库。

context = etree.iterparse(PATH_TO_XML, dtd_validation=True, events=("end",)) 
for event, element in context: 
    tag = element.tag 
    if tag == "a": 
     print element.text # is empty :/ 
     mystring = element.xpath("string()") 
     ... 

但不知何故,它出错了。

我要的是整个字符串

"This is some text about some issue I have, parsing xml" 

但我只得到一个空字符串。有什么建议么?谢谢!

回答

相关问题