2012-09-04 34 views
0

所以我一直在使用CURL和simple_html_dom一段时间,对于任何不熟悉简单HTML DOM的人来说 - 它允许您轻松浏览元素,并且不必使用正则表达式/爆炸等等的麻烦上。酷似简单HTML DOM的CURL类?

E.g.

$html = file_get_html($obj->loc); 
$item['title'] = $html->find('#Prod-Name h1',0)->plaintext; 

但是,据我所知,这不支持cookie - 就像CURL所做的那样,有没有什么东西可以做?

有兴趣听​​到人们在这个屏幕上抓取/创造机器人的经验。

回答

0

您可以使用curl下载并使用您选择的解析库进行解析。我有时候会使用这种方法,但我对此并不满意,如果php有一些体面的抓取库,如果它们是内置的,那么它会更好。

+0

不知何故忽略了这一点!谢谢! –