2016-04-12 95 views
1

我想开发web刮板,我可以从页面中提取所有链接,但我想要获得一些特定的链接,但我无法管理它,因为我没有HTML中的丰富知识未经书面编辑Java jsoup选择链接

enter image description here

+1

请告诉我们,到目前为止你已经尝试了什么。此外,当您发布屏幕截图时,用户将无法复制HTML源代码。详情请看这里http://stackoverflow.com/help/mcve – nyname00

回答

1

您可以使用下面的代码片段呈现的CSS选择器:

doc.select("div.indepth-content > div.content > ul.indepth-list a") 

的截图,看来你使用Chrome浏览器。如果是这样,下次你可以问它来生成CSS查询您:

  1. 右键单击(节点应该选定)你的目标
  2. 点击“检查”的元素
  3. 上右键点击这个节点上,然后选择复制进入和复制选择子项

=> CSS选择在剪贴板复制

请注意,Chrome倾向于生成(很长)CSS查询。另外,它不能生成用于匹配多个元素的CSS选择器。

然而,如果键入CTRL + ˚F而DevTools窗格被打开和选定的元素标签中,可以键入一个CSS选择器和匹配元件之间浏览。


有关详细信息,你可以看看下面的资源:

1
Element divcontent = doc.select("div.content").first(); 
Element ul = divcontent.select("ul.indepth-list").first(); 
ul.select("a[href]"); 

,所以我不记得,如果语法是正确的。