2012-02-29 23 views
0

这个XML文件被命名为example.xml写XML命名空间:的Python:阅读和使用ElementTree的

<?xml version="1.0"?> 
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd"> 

    <modelVersion>14.0.0</modelVersion> 
    <groupId>.com.foobar.flubber</groupId> 
    <artifactId>uberportalconf</artifactId> 
    <version>13-SNAPSHOT</version> 
    <packaging>pom</packaging> 
    <name>Environment for UberPortalConf</name> 
    <description>This is the description</description>  
    <properties> 
     <birduberportal.version>11</birduberportal.version> 
     <promotiondevice.version>9</promotiondevice.version> 
     <foobarportal.version>6</foobarportal.version> 
     <eventuberdevice.version>2</eventuberdevice.version> 
    </properties> 
    <!-- A lot more here, but as it is irrelevant for the problem I have removed it --> 
</project> 

如果我加载的example.xml文件上面使用的ElementTree和打印根节点:

>>> from xml.etree import ElementTree 
>>> tree = ElementTree.parse('example.xml') 
>>> print tree.getroot() 
<Element '{http://maven.apache.org/POM/4.0.0}project' at 0x26ee0f0> 

我看到Element还包含名称空间http://maven.apache.org/POM/4.0.0

我如何:

  1. 获取foobarportal.version文本,由一个增加它并写XML文件后面,同时保持文件加载时已经命名空间,也不会改变整体XML布局。
  2. 让它使用任何命名空间加载,而不仅仅是http://maven.apache.org/POM/4.0.0。我仍然不想剥离命名空间,因为我希望XML保持不变,除了更改foobarportal.version,如上面的。

目前的方法是没有意识到XML的但满足和以上:

  1. grep的用于<foobarportal.version>(.*)</foobarportal.version>
  2. 采取匹配组的内容和i增加1增加它
  3. 写回来。

这将是一个很好的XML感知解决方案,因为它会更健壮。 ElementTree的XML名称空间处理使其更加复杂。

+0

从来就试过'树。 getroot()。find('project')'由于命名空间而不起作用。之后,我几乎卡住了,文档没有帮助我。 – Deleted 2012-02-29 15:26:57

+0

在问题中向我们展示您尝试过的代码。 – Marcin 2012-02-29 15:43:41

回答

2

如果你的问题很简单:“我怎么被命名空间中的元素名称搜索”,那么答案是lxml的理解{namespace}语法,所以你可以这样做:

tree.getroot().find('{http://maven.apache.org/POM/4.0.0}project')