2016-11-22 158 views
-2

我想选择与Jsoup选择HTML标签与Jsoup

<html> 
<head></head> 
<body> 
..... 
</body> 
</html> 

所有的HTML标签代码,我试过了:

Document dc = Jsoup.parse(fichier, "utf-8"); 
String tags = dc.outerHtml(); 
+2

...,什么是您尝试输出?对于我们来帮助解决您的问题,我们需要更多的上下文:请查看[如何提出一个好问题]的指导原则(http://stackoverflow.com/help/how-to-ask) – emunsing

+0

您可以添加你想要选择什么样的例子,它与你的代码有什么不同? – Pshemo

回答

1

你的问题目前尚不清楚,但似乎你只是想获得所有的标签节点名称,这样做,你可以解析HTML和getAllElements(),然后遍历列表元素得到nodeName()每个,使用Java 8利用forEach您的代码可能是这样的:

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.select.Elements; 

public class JSoup { 

    public static void main(String[] args) { 

     String fichier = "<html>" + 
          "<head></head>" + 
          "<body></body>" + 
          "</html>"; 
     Document dc = Jsoup.parse(fichier, "utf-8"); 
     Elements elements = dc.getAllElements(); 
     elements.forEach(element -> System.out.println(element.nodeName())); 
    } 
} 

这个代码打印出所有的标签节点名称:

#document 
html 
head 
body