2012-12-11 49 views
0

我有一个网址,我必须在url中找到联系链接。给定一个网址查找联系链接

所以我做的是使用simple_html_dom.php来遍历所有的标签,如果它包含单词“联系”或“广告”,那么它是联系人的网址。但这实际上非常缓慢。

因此,我现在要做的就是使用卷曲(没问题,甚至在将来会多卷曲)刮掉页面,并且如果链接包含“联系人”,则正则表达式尝试在刮取结果中查找aa href链接。或“广告”。

我会使用preg_match_all但正则表达式是什么?

+0

如何利用谷歌做搜索\为您抓取? – 2012-12-11 22:31:49

+0

Dom,xpath,'// a [包含(@ href,'contact')]'...完成。 '简单的dom'适用于那些拥有巨大的备用cpu周期的人......慢,慢,慢。 – Wrikken

+0

什么是'simple_html_dom.php'?需要参考 – Alexander

回答

1
preg_match_all('/\<a href\=\"(.*?(contact|advertis)+.*?)\"\>(.+?)\<\/a>/m', $page, $matches); 
+0

谢谢,这个工程。我将使用这个或DOM模块。谢谢! – gprime

+0

乐于帮助! –