2016-08-02 32 views
1

我想获得第一个标题并打印出来。到目前为止,我浏览过HTML并找到了搜索标题的方法。Java:我如何使用jsoup从新闻页面中提取标题?

data-pb-placeholder="Write headline here" 

该代码通常位于我想要的任何标题之前。到目前为止,我有...

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 
Element headline = doc.select("headline").first(); 
System.out.println(headline); 

它只输出null。我不确定我如何搜索文档并找到标题。

回答

1

它看起来像头条都在<div class="headline">。您可以使用CSS selectors来定位这些并提取它们的文本节点。

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 

    for (Element headline : doc.select("div.headline")) 
     System.out.println(headline.text()); 
相关问题