我正试图解析一个大的XML文件。脚本无法访问内部标签中的内容
它具有以下结构。
<merchandiser>
<header></header>
<product>
<name></name>
<URL>
<info>
</info>
<product>
</product>
</URL>
</product>
............
<product>
<name></name>
<URL>
<info>
</info>
<product>
</product>
</URL>
</product>
</merchandiser>
我使用python-lxml库中的iter.parse()。
for event , element in etree.iterparse(xmlfile,tag='product'):
if element.tag=="product" and event == "end":
if element.findall("..")[0].tag=='merchandiser':
print element.xpath('./URL/product/text()')
print element.xpath('./URL/info/text()')
element.clear()
该脚本打印标签内的文本,但无法打印标签内的文本。
我觉得它是因为相同的标签名称。
请告诉我我做错了什么?
“脚本打印标签内的文本,但无法打印标签内的文本。”?你能编辑你的问题吗? –