Jsoup /爪哇 - 如何提取数据不是一个标签内

我要解析这样Jsoup /爪哇 - 如何提取数据不是一个标签内

<span class="legenda">Cargo a que concorre:</span> Vereador<br /> 
<span class="legenda">Nome para urna:</span> Adeilza<br /> 
<span class="legenda">Número:</span> 40656<br /> 
<span class="legenda">Estado:</span> Amapá<br /> 
<span class="legenda">Município:</span> Vitória do Jari<br /> 
<span class="legenda">Partido:</span> Partido Socialista Brasileiro - PSB<br /> 
<span class="legenda">Coligação:</span> Vitória para todos (PSB/PV/PRTB)<br />

我使用jsoup来解析，并按照例子HTML，但我不知道如何在这种情况下获得值。例如“Vereador”或“Adeilza”。有一种方法可以用jsoup来做到这一点吗？

这里是链接，如果有人想看到所有的html页面。查看源代码：在jSoup Elementhttp://www.eleicoes2012.info/adeilza-psb-40656/

来源

2014-02-16 user3249186

调用nextSibling会给你下一个Node发现。在这种情况下，您可以使用span元素的选择器legenda，然后致电nextSibling。简单的例子：

Document doc = Jsoup.connect("http://www.eleicoes2012.info/adeilza-psb-40656/").get(); 
Elements spans = doc.select("span.legenda"); 

for(Element span: spans) { 
    System.out.println(span.nextSibling()); 
}

生成此输出对我来说：

Adeilza Ribeiro de Souza 
30 anos (09/08/1983) 
Almeirim/PA 
Solteiro(A) 
Dona de Casa 
Ensino Fundamental Incompleto 

0 Votos 
Vereador 
Adeilza 
40656 
Amap&aacute; 
Vit&oacute;ria do Jari 
Partido Socialista Brasileiro - PSB 
Vit&oacute;ria para todos (PSB/PV/PRTB)

来源

2014-02-16 03:18:26 Durandal

它的工作原理。非常感谢！ – user3249186

Jsoup /爪哇 - 如何提取数据不是一个标签内

回答

相关问题