2012-09-14 61 views
0

我正在寻找一个库,类,函数等,我可以为它提供一个html字符串并找到像src或href之类的东西。我知道我可以找到一个正则表达式的具体情况,但我正在寻找一个库,它可以很容易地得到的东西,而不是每次都找出新的正则表达式。用于从html获取属性的库

+2

的DomDocument php.net/manual/en/ class.domdocument.php会在这里做到这一点。 – Sammaye

回答

1

SimpleHTMLDOM是您在这种情况下的朋友。 REGEX永远不是最好的方式(对于HTML标签)。

例子:

$html = file_get_html('http://www.google.com/'); 

// Find all images 
foreach($html->find('img') as $element) { 
     echo $element->src . '<br>'; # givs you the image 'src' attribute for each image on that page. 
} 
+0

谢谢,这对我来说工作得很好。这里稍微额外的搜索显示一些ppl有问题,并推荐类似的库。但到目前为止,这么好。 –