当我解析此代码Jsoup:Jsoup解析错误(标签p范围内的标签表)
<p>
<table>[...]</table>
</p>
Jsoup返回:
<p></p>
<table>[...]</table>
这是一个错误?我怎样才能解决这个问题?
当我解析此代码Jsoup:Jsoup解析错误(标签p范围内的标签表)
<p>
<table>[...]</table>
</p>
Jsoup返回:
<p></p>
<table>[...]</table>
这是一个错误?我怎样才能解决这个问题?
我认为它与你的例子不是“有效”的HTML有关。我相信一个表不能存在于p标签中。 Jsoup可能会执行正确的HTML。
jsoup非常聪明。如果您使用其默认解析方法,它会将您的输入文本重新组合为有效的html内容。
Document doc = Jsoup.parse(html);
其实,jsoup可以处理象XML文本(当然,包括HTML和XML)。您可以尝试使用follwing方法来解析类xml文本。它不会改变您的输入,并按原样解析输入。
Document doc = Jsoup.parse(html, "", Parser.xmlParser());
这并不回答OP的问题,即Jsoup的回报是否是错误的。 – verdammelt 2014-03-11 14:05:53
@ verdammelt,是的,它可能会从Jsoup返回无效的html代码。但提问者可能想找到一种方法来避免智能jsoup的检查和重组过程。 – 2014-03-11 14:33:39
如果我默认标签代替p标签,然后用jsoup解析代码....效果很好。 – miaccio 2012-04-04 08:46:38