可能重复:
RegEx match open tags except XHTML self-contained tags
Grabbing the href attribute of an A element创建一个简单的正则表达式刮网址
我试图刮去以下字符串的URL ...
<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>
这里是我现在得到的正则表达式...
<a class="uf" href="(.*?)">.*?<\/a>
但是,它在抓取页面时没有得到任何结果。
我在这里做错了什么?
顺便说一句,我在PHP中这样做。
呃哦。注意,人们会试图用正则表达式来解析URL ...在某处使用实际的解析器。 – kevlar1818
*(相关)* [解析HTML的最佳方法](http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon