我有相当复杂的XML这样的工作的工作:LXML与命名空间
<?xml version="1.0" encoding="UTF-8"?>
<!-- ***** Configuration Data exported at 20160623T110335 ***** -->
<impex:ExportData xmlns:impex="urn:swift:saa:xsd:impex">
<!-- *** Exported Data for Operator *** -->
<OperatorData xmlns="urn:swift:saa:xsd:impex:operator">
<ns2:OperatorDefinition xmlns="urn:swift:saa:xsd:operatorprofile" xmlns:ns2="urn:swift:saa:xsd:impex:operator" xmlns:ns3="urn:swift:saa:xsd:unit" xmlns:ns4="urn:swift:saa:xsd:licenseddestination" xmlns:ns5="urn:swift:saa:xsd:operator" xmlns:ns6="urn:swift:saa:xsd:authenticationservergroup">
<ns2:Operator>
<ns5:Identifier>
<ns5:Name>jdoe</ns5:Name>
</ns5:Identifier>
<ns5:Description>John Doe</ns5:Description>
<ns5:OperatorType>HUMAN</ns5:OperatorType>
<ns5:AuthenticationType>LDAP</ns5:AuthenticationType>
<ns5:AuthenticationServerGroup>
<ns6:Type>LDAP</ns6:Type>
<ns6:Name>LDAP_GROUP1</ns6:Name>
</ns5:AuthenticationServerGroup>
<ns5:LdapUserId>jdoe</ns5:LdapUserId>
<ns5:Profile>
<Name>DEV Users</Name>
</ns5:Profile>
<ns5:Unit>
<ns3:Name>None</ns3:Name>
</ns5:Unit>
</ns2:Operator>
</ns2:OperatorDefinition>
</OperatorData>
</impex:ExportData>
在这个XML有许多<ns2:OperatorDefinition>
元素像我包括在内。我很难理解如何使用lxml提取类似<ns5:Description>
的东西。所有我找到的命名空间的例子都不是这个复杂的。
我想只需找到做这样的事情的标签 -
from lxml import etree
doc = etree.parse('c:/robin/Operators_out.xml')
r = doc.xpath('/x:OperatorData/ns2:OperatorDefinition', namespaces={'x': 'urn:swift:saa:xsd:impex:operator'})
print len(r)
print r[0].text
print r[0].tag
我得到Undefined namespace prefix
。
由于您尚未在'namespaces'字典中包含'ns2'前缀的定义,因此您会得到“未定义的命名空间前缀”。 – mzjn