2012-02-23 135 views
5

如何从以下使用Jsoup的html代码获取“本文”?如何使用Jsoup获取此文本?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
     height=10 src="img.jpg" /><span class="blah"> 
     <span>Other texts</span><span class="sometime">00:00</span></span> 
     </a></h2> 

当我尝试

String s = document.select("h2.title").select("a[href]").first().text(); 

返回

这textOther texts00:00

我试图在Jsoup阅读API为Selector想不出出多了。

另外我如何获得类class="link title blah"(多个类?)的元素。原谅我,我只知道Jsoup和CSS。

回答

9

使用Element#ownText()而不是Element#text()

String s = document.select("h2.link.title a[href]").first().ownText(); 

请注意,您可以通过只串联的类名选择在一起,就像是h2.link.title这将选择至少有两个linktitle元素<h2>选择多类元素。

+0

谢谢你,工作得很好:) – wildnux 2012-02-23 16:50:07

+0

另外我如何获得类'class =“链接标题等等”(多个类)的元素? – wildnux 2012-02-23 16:51:17

+0

仔细检查代码示例。之后我给答案添加了解释。 – BalusC 2012-02-23 16:52:21