我是新来的刮。我正在尝试使用JSOUP从网站上抓取数据。我想从<div>
,<span>
,<p>
等标签中抓取数据。有人可以告诉我如何做到这一点?用JSOUP刮网
Q
用JSOUP刮网
-3
A
回答
1
检查this。一个基本的例子:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Test {
public static void main(String[] args) throws Exception {
String url = "https://stackoverflow.com/questions/2835505";
Document document = Jsoup.connect(url).get();
String text = document.select("div").first().text();
System.out.println(text);
Elements links = document.select("a");
for (Element link : links) {
System.out.println(link.attr("href"));
}
}
}
这将首先打印页上的第一div
的文本,然后打印出网页上的所有链接(a
)的所有URL。
为了获得股利的具体类,请Elements elements = document.select("div.someclass")
要与特定的id来获取申报单,做Elements elements = document.select("div#someclass")
如果你想通过所有选定的元素,这样做:
for (Element e:elements) {
System.out.println(e.text());
//you can also do other things.
}
相关问题
- 1. 用Jsoup刮
- 2. Java-JSoup刮动态网站
- 3. jsoup问题刮脸网站
- 4. 使用JSoup登录之前刮网站
- 5. Jsoup的Java刮tickersymbol
- 6. JSOUP问题刮脸表
- 7. 用jsoup和android刮去网站的链接
- 8. 用jsoup从页面中刮取文本
- 9. 使用jsoup刮谷歌广告
- 10. 使用JSoup的数据刮擦?
- 11. 使用JSoup刮谷歌天气结果
- 12. 用jsoup在Android中刮开初学者
- 13. 使用JSoup的屏幕刮擦
- 14. 用LUA刮网
- 15. 与Jsoup的网页刮擦只能运行一半的时间
- 16. Jsoup从div的儿童刮文本
- 17. 更好的方法来与Jsoup刮
- 18. “屏幕刮”与Jsoup元素谁有ID
- 19. JSoup需要太长的时间来加载和有时使用JSoup刮从网络数据时不取
- 20. 登录网站使用jsoup
- 21. 使用Jsoup遍历网络
- 22. 刮网站
- 23. Python网络刮
- 24. 刮网页
- 25. 刮网址
- 26. 刮网页
- 27. 刮网址
- 28. 刮网页
- 29. 网站刮图
- 30. 刮javascript网站
请告诉我们,到目前为止您已经尝试过,SO不是神奇地获取代码的地方。 – Zhedar
http://jsoup.org/cookbook/ –
我刚做了一个新项目,并添加了一个jsoup jar文件并建立了连接。我其实是新来的。我想要取消驻留在不同标签中的数据,如上所示。 plzzz帮助我 –