2016-12-13 65 views
0

的内容我有这样的HTML源代码,我想分析Jsoup脱逃的iframe

<div> 
<iframe><script>alert('hello')</script></iframe> 
</div> 

当我解析使用Jsoup和打印中的HTML我得到这个。

<div> 
<iframe>&lt;script&gt;alert('hello')&lt;/script&gt;</iframe> 
</div> 

我不想让Jsoup转换iframe中的内容。我怎样才能做到这一点?。示例代码

Document doc = Jsoup.parse(html); 
System.out.println(doc.body().html()); 

回答

2

可以使用jsoup解析器的unescapeEntities(字符串,boolean)方法:

Document doc = Jsoup.parse(html);    
System.out.println(org.jsoup.parser.Parser.unescapeEntities(doc.body().html(), true)); 
+0

嗯,这一切未逸出,不仅里面有什么