2014-02-16 33 views
2

我要解析这样Jsoup /爪哇 - 如何提取数据不是一个标签内

<span class="legenda">Cargo a que concorre:</span> Vereador<br /> 
<span class="legenda">Nome para urna:</span> Adeilza<br /> 
<span class="legenda">Número:</span> 40656<br /> 
<span class="legenda">Estado:</span> Amapá<br /> 
<span class="legenda">Município:</span> Vitória do Jari<br /> 
<span class="legenda">Partido:</span> Partido Socialista Brasileiro - PSB<br /> 
<span class="legenda">Coligação:</span> Vitória para todos (PSB/PV/PRTB)<br /> 

我使用jsoup来解析,并按照例子HTML,但我不知道如何在这种情况下获得值。例如“Vereador”或“Adeilza”。 有一种方法可以用jsoup来做到这一点吗?

这里是链接,如果有人想看到所有的html页面。 查看源代码:在jSoup Elementhttp://www.eleicoes2012.info/adeilza-psb-40656/

回答

2

调用nextSibling会给你下一个Node发现。在这种情况下,您可以使用span元素的选择器legenda,然后致电nextSibling。简单的例子:

Document doc = Jsoup.connect("http://www.eleicoes2012.info/adeilza-psb-40656/").get(); 
Elements spans = doc.select("span.legenda"); 

for(Element span: spans) { 
    System.out.println(span.nextSibling()); 
} 

生成此输出对我来说:

Adeilza Ribeiro de Souza 
30 anos (09/08/1983) 
Almeirim/PA 
Solteiro(A) 
Dona de Casa 
Ensino Fundamental Incompleto 

0 Votos 
Vereador 
Adeilza 
40656 
Amap&aacute; 
Vit&oacute;ria do Jari 
Partido Socialista Brasileiro - PSB 
Vit&oacute;ria para todos (PSB/PV/PRTB) 
+0

它的工作原理。非常感谢! – user3249186