2016-08-21 78 views
0

我试图解析Groovydoc,但Jsoup没有找到包含所有东西的框架集。无法解析框架集的网页

 Connection connection=Jsoup.connect('http://groovy-lang.org/api.html') 
     Document document=connection.get() 
     Elements element= document.getElementsByTag('frameset') 
     element.each {println(it)} 

回答

0

如果您检查由connection.get()返回的结果可以看到,有没有frameset标签:

println document 

现在,如果你在浏览器中打开该网站,并使用开发工具来看看在它的html代码中,您可以看到frameset您正在寻找的是来自http://docs.groovy-lang.org/latest/html/gapiiframe的孩子。

只需加载iframe网址与Jsoup得到frameset

Connection connection = Jsoup.connect('http://docs.groovy-lang.org/latest/html/gapi') 
Document document = connection.get() 
Elements element = document.getElementsByTag('frameset') 
element.each { println it } 

或者,如果你不想硬编码iframe源URL解析,看this如何获取源URL,这样回答