2011-08-04 58 views
-2

可能重复:
RegEx match open tags except XHTML self-contained tags
Grabbing the href attribute of an A element创建一个简单的正则表达式刮网址

我试图刮去以下字符串的URL ...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 

这里是我现在得到的正则表达式...

<a class="uf" href="(.*?)">.*?<\/a> 

但是,它在抓取页面时没有得到任何结果。

我在这里做错了什么?

顺便说一句,我在PHP中这样做。

+0

呃哦。注意,人们会试图用正则表达式来解析URL ...在某处使用实际的解析器。 – kevlar1818

+0

*(相关)* [解析HTML的最佳方法](http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon

回答

1

其实您正则表达式工作得很好。你应该提供更深入的尝试完成

试试这个什么:

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text'; 
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches); 
print_r($matches); 
exit; 

它会打印:

Array 
(
    [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 
    [1] => -- 
) 

这是预期的结果,据我所看到