2012-06-22 124 views
0

更新jsoup如何提取本文

我试图从here提取“分享Tweet每小时”的信息。但是,当我从jsoup打印出html时,我无法在任何地方找到这些信息。

任何提示?

我试图从下面的代码中使用jsoup提取文本“ 105 TPH”。

<div id="speed_realtime" class="speed"> 
<a title="Tweets Per Hour">105 TPH</a> 
</div 

这是正确的吗?

Element t = doc.select("a[title=Tweets Per Hour]").first(); 
tph = t.text(); 

回答

1

是的,为什么呢?不是在工作吗?

你也可以做这样的事情:

Element tph = doc.select("#speed_realtime").select("a").first().text(); 

Element tph = doc.select("a[title]").first().text(); 

看一看的文档查看选项...

Use selector-syntax to find elements

Use DOM methods to navigate a document


编辑

尝试这样的事情

Document doc = Jsoup.connect("http://www.twazzup.com/?q=mls&l=en").userAgent("Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)").get(); 
+0

嗨! Thx很多你的帮助!我意识到我正在看错地方(更新上面)! – ytz

+0

更新了我的答案... – Daniel

+0

Thx为您的快速回复。虽然没有区别,但:( – ytz