2012-10-19 105 views
1

我在解析Java中的XML文件时遇到了一些麻烦。该文件的形式为:带有重复标签的XPath和Java

<root> 
    <thing> 
    <name>Thing1</name> 
    <property> 
     <name>Property1</name> 
    </property> 
    ... 
    </thing> 
    ... 
</root> 

最后,我想这个文件转换成的事对象的列表,这将有一个String名称(Thing1)和Property对象的名单,这将各自也有一个名字(Property1)。

我一直在试图使用xpaths来获取这些数据,但是当我试图得到'thing'的名字时,它给了我所有出现在'thing'中的名字,包括那些“酒店的。我的代码是:

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 
DocumentBuilder db = dbf.newDocumentBuilder(); 
Document dom = db.parse(filename); 
XPath xpath = XPathFactory.newInstance().newXPath(); 


XPathExpression thingExpr = xpath.compile("//thing"); 
NodeList things = (NodeList)thingExpr.evaluate(dom, XPathConstants.NODESET); 
for(int count = 0; count < things.getLength(); count++) 
{ 
    Element thing = (Element)things.item(count); 
    XPathExpression nameExpr = xpath.compile(".//name/text()"); 
    NodeList name = (NodeList) nameExpr.evaluate(thing, XPathConstants.NODESET); 
    for(int i = 0; i < name.getLength(); i++) 
    { 
     System.out.println(name.item(i).getNodeValue());  
    } 
} 

任何人都可以帮忙吗?提前致谢!

+0

输出,它似乎并不认为你已经表示要生产使用什么XPath - 即使考虑了评论。 Xpath用于选择我们感兴趣的某些特定节点 - 它们是在您的特定情况下?你想从这些特定节点提取哪些数据?请编辑问题并指定这些缺失和重要的信息。 –

回答

1

你可以尝试像...

public class TestXPath { 

    public static void main(String[] args) { 
     String xml = 
         "<root>\n" 
         + " <thing>\n" 
         + "  <name>Thing1</name>\n" 
         + "  <property>\n" 
         + "   <name>Property1</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property2</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property3</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property4</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property5</name>\n" 
         + "  </property>\n" 
         + " </thing>/n" 
         + " <NoAThin>\n" 
         + "  <name>Thing2</name>\n" 
         + "  <property>\n" 
         + "   <name>Property1</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property2</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property3</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property4</name>\n" 
         + "  </property>\n" 
         + "  <property>\n" 
         + "   <name>Property5</name>\n" 
         + "  </property>\n" 
         + " </NoAThin>/n" 
         + "</root>"; 

     try { 
      DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 
      DocumentBuilder db = dbf.newDocumentBuilder(); 
      ByteArrayInputStream bais = new ByteArrayInputStream(xml.getBytes()); 
      Document dom = db.parse(bais); 
      XPath xpath = XPathFactory.newInstance().newXPath(); 

      // Find the "thing" node... 
      XPathExpression thingExpr = xpath.compile("/root/thing"); 
      NodeList things = (NodeList) thingExpr.evaluate(dom, XPathConstants.NODESET); 

      System.out.println("Found " + things.getLength() + " thing nodes..."); 

      // Find the property nodes of thing 
      XPathExpression expr = xpath.compile("property"); 
      NodeList nodes = (NodeList) expr.evaluate(things.item(0), XPathConstants.NODESET); 

      System.out.println("Found " + nodes.getLength() + " thing/property nodes..."); 

      // Find all the property "name" nodes under thing 
      expr = xpath.compile("property/name"); 
      nodes = (NodeList) expr.evaluate(things.item(0), XPathConstants.NODESET); 

      System.out.println("Found " + nodes.getLength() + " name nodes..."); 
      System.out.println("Property value = " + nodes.item(0).getTextContent()); 

      // Find all nodes that have property nodes 
      XPathExpression exprAll = xpath.compile("/root/*/property"); 
      NodeList nodesAll = (NodeList) exprAll.evaluate(dom, XPathConstants.NODESET); 
      System.out.println("Found " + nodesAll.getLength() + " property nodes..."); 

     } catch (Exception exp) { 
      exp.printStackTrace(); 
     } 
    } 
} 

,这将给你的像

Found 1 thing nodes... 
Found 5 thing/property nodes... 
Found 5 name nodes... 
Property value = Property1 
Found 10 property nodes... 
+0

这样做,谢谢! – KritSandvich

0

"//thing/name/text()"怎么样?

您现在使用双斜杠name表示“树中的任何位置,不一定是直接的子节点”。

+0

这确实让我得到了所有的名字,但是如果我稍后用属性名称做同样的事情,我不知道如何匹配它们:/。之后我会使用“.//”,因为我被告知这是一个相对xpath。 – KritSandvich

0

使用这些XPath表达式

//thing[name='Thing1'] 

这个选择XML文档中的任何thing元素,具有name的孩子,他的字符串值是"Thing1"

也使用

//property[name='Property1'] 

这个选择XML文档中的任何property元素,具有name的孩子,他的字符串值"Property1"

更新

要获得所有文本节点,每个节点包含thing元素的字符串值,只是做

//thing/text() 

在XPath 2.0一个可以得到的序列字符串本身,使用:

//thing/string(.) 

这不是possi与单个XPath表达式竹叶提取,但可以得到一个特定(第n个)thing元件这样的字符串值:

string((//thing)[$n]) 

$n其中必须以特定数量被取代1至count(//thing)。从1至cnt$n循环

count(//thing) 

,然后动态生成的XPath表达式并评价它:

因此,在你prograaming语言,可以先通过评估该XPath表达式确定cnt

string((//thing)[$n]) 

与获得property元素的所有值完全相同。

+0

这是假设我已经知道事物的名称,我不......这就是我正在寻找:) – KritSandvich

+0

@KritSandvich:请参阅我的答案的更新。 –