1
我正在使用Jsoup尝试清理几乎所有的文档中的html,但白名单范围标记特定类。Jsoup可以根据类清理元素吗?
我这有,但很明显,这最终让所有的跨度使用attr类
String html = "<p><strong>Lorem ipsum dolor<br /> sit amet</strong></p>"+
"<span class=\"killme\">Aenean</span> quam sem" +
"<span class=\"whitelistme\">lacinia molestie</span> nibh mattis ";
String clean = Jsoup.clean(html,
Whitelist.none()
.addTags("span")
.addAttributes("span", "class"));
有没有办法清理所有HTML除了<跨度类=“whitelistme”>?
所以我的最终结果将是
Lorem ipsum dolor sit amet
Aenean quam sem
<span class="whitelistme">lacinia molestie</span> nibh mattis
感谢D1e,事实上,这将成为诀窍,但正如你所说的,这是硬编码。我期待沿着jQuery选择器的方式,像.clean(“。whitelistme”).. – maverick
你也可以尝试调整一些源代码,如果它是合法的当然。 使用clean()方法作为示例来实现自己的方法,如clean(EnumHtml.Tag ... excludes)。 – JMelnik
是的,它是在公共场合,我可能会试试这个。 bTW,我会给你这个信用。谢谢 – maverick