美好的一天,我是Java的新手,我试图从互联网上捕捉一些数据。如果我想举一个例子搜索谷歌并存储结果数量和搜索时间。 我想过使用jsoup DOM功能,但我无法弄清楚如何获取特定元素的值。在Java中从互联网中获取数据
如果我使用谷歌浏览器检查元素我很感兴趣,该位为
<div id="resultStats">
About 6,480,000,000 results
<nobr> (0.26 seconds) </nobr>
</div>
那是我唯一可以开始工作,但文档不包括该元素。
import org.jsoup.nodes.Document;
import java.io.IOException;
public class google_time {
public static void main(String[] args) throws IOException {
String url = "https://www.google.com/webhp?hl=en&tab=Tw&q=data#hl=en&newwindow=1&output=search&sclient=psy-ab&q=data&oq=data&gs_l=hp.12...0.0.0.1682.0.0.0.0.0.0.0.0..0.0.les%3B..0.0...1c.Q9UUbwkFy-I&pbx=1&bav=on.2,or.r_gc.r_pw.r_cp.r_qf.&fp=6a12f0870d3ff179&biw=1066&bih=483";
Document doc = Jsoup.connect(url).get();
System.out.println(doc);
}
}
那么如何我只得到该位resultStatic,并在那里的文本?
jsoup提供您可以导航的DOM(文档对象模型),尝试阅读[示例](http://jsoup.org/cookbook/extracting-data/dom-navigation) – MadProgrammer
也可以查看[this] (https://norrisshelton.wordpress.com/2011/01/27/jsoup-java-html-parser/),特别是关于'jquery'和[例子]的部分(http://jsoup.org/cookboo k/extract-data/selector-syntax) – MadProgrammer