2012-04-03 81 views

回答

0

我认为它与你的例子不是“有效”的HTML有关。我相信一个表不能存在于p标签中。 Jsoup可能会执行正确的HTML。

+0

如果我默认标签代替p标签,然后用jsoup解析代码....效果很好。 – miaccio 2012-04-04 08:46:38

0

jsoup非常聪明。如果您使用其默认解析方法,它会将您的输入文本重新组合为有效的html内容。

Document doc = Jsoup.parse(html);

其实,jsoup可以处理象XML文本(当然,包括HTML和XML)。您可以尝试使用follwing方法来解析类xml文本。它不会改变您的输入,并按原样解析输入。

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

+0

这并不回答OP的问题,即Jsoup的回报是否是错误的。 – verdammelt 2014-03-11 14:05:53

+0

@ verdammelt,是的,它可能会从Jsoup返回无效的html代码。但提问者可能想找到一种方法来避免智能jsoup的检查和重组过程。 – 2014-03-11 14:33:39