2012-09-06 77 views

回答

0

您在整个数据完全读出,然后用正则表达式解析它提取链接。在这里阅读更多:http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/

+1

Ermm ......没人提到托尼的小马驹??? http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –

+0

取决于案件。我在分析特定来源的链接和/或其他内容时使用了正则表达式。如果案例是解析通用链接,那么也许另一种方法更好。 – Endy

1

我强烈建议你不要使用正则表达式来“解析”HTML。除非您可以控制正在处理的网页的格式,否则基于正则表达式的解决方案可能会变得脆弱和错误。

而是使用宽容的HTML解析器。这个问题可以让多个解决方案:HTML/XML Parser for Java