1
我使用jSoup库在Java上从this link上刮取。我的源代码运行良好,我想问如何拆分我得到的每个元素?拆分jSoup抓取结果
这里我源
package javaapplication1;
import java.io.IOException;
import java.sql.SQLException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class coba {
public static void main(String[] args) throws SQLException {
MasukDB db=new MasukDB();
try {
Document doc = null;
for (int page = 1; page < 2; page++) {
doc = Jsoup.connect("http://hackaday.com/page/" + page).get();
System.out.println("title : " + doc.select(".entry-title>a").text() + "\n");
System.out.println("link : " + doc.select(".entry-title>a").attr("href") + "\n");
System.out.println("body : " + String.join("", doc.select(".entry-content p").text()) + "\n");
System.out.println("date : " + doc.select(".entry-date>a").text() + "\n");
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
在结果中,网站的每一个页面变成一条线,如何拆分它的家伙?以及如何获得对每一篇文章的链接,我想在链接方面我的CSS选择器仍然是错误的 感谢队友
非常感谢你的伴侣,你的脚本工作得很好,它像我明智:) 它与我的scrapy使用python几乎相同:D再次感谢 – jethow