我使用JSOUP过滤链接出html身体。Jsoup为不同的网站选择链接
这样一个网页:https://en.wikipedia.org/wiki/Cloud_computing
我要过滤链接,如: https://en.wikipedia.org/wiki/Light
哈希标签链接en.wikipedia.org/wiki/Cloud_computing#cite_note-1
我尝试doc.select("a[href*=#]").remove();
它工作得很好,在HTML页面哈希标记链接src:<a href="#cite_ref-1">
但是当我使用doc.select("a[href]*=/]").remove();
其中l油墨页面html src
<a href="/wiki/Light">CH</a>
但仍有尚未过滤的链接。这怎么可能?
如果我的回答解决你所描述的问题,那么你就应该接受它,以便该线程可以考虑关闭。如果没有,那么请提供一些反馈,以便我可以更新我的答案 – alkis
非常感谢我检查你的答案再次与我的代码,它的作品。 – Rehama