创建一个简单的正则表达式刮网址

-2

可能重复：
RegEx match open tags except XHTML self-contained tags
Grabbing the href attribute of an A element 创建一个简单的正则表达式刮网址

我试图刮去以下字符串的URL ...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>

这里是我现在得到的正则表达式...

<a class="uf" href="(.*?)">.*?<\/a>

但是，它在抓取页面时没有得到任何结果。

我在这里做错了什么？

顺便说一句，我在PHP中这样做。

来源

2011-08-04 Chris R.

呃哦。注意，人们会试图用正则表达式来解析URL ...在某处使用实际的解析器。 – kevlar1818

*（相关）* [解析HTML的最佳方法]（http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662） – Gordon

<a class="uf" href="[A-Za-z_-\.]*?">[A-Za-z_-\.]*?<\/a>

也不能忘记： RegEx match open tags except XHTML self-contained tags

来源

2011-08-04 17:03:35 Neal

其实您正则表达式工作得很好。你应该提供更深入的尝试完成

试试这个什么：

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text'; 
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches); 
print_r($matches); 
exit;

它会打印：

Array 
(
    [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 
    [1] => -- 
)

这是预期的结果，据我所看到

来源

2011-08-04 17:09:09

创建一个简单的正则表达式刮网址

回答

相关问题