如何将标题发送到网站,就好像PHP/Apache是浏览器一样?我试图刮一个网站,但它看起来像他们发送一个404错误,如果它来自另一台服务器...通过PHP发送浏览器标题
或者,如果你知道任何其他好方法从网站刮内容?
而且,这里是我当前的代码:
<?php
$curl_handle=curl_init();
curl_setopt($curl_handle,CURLOPT_URL,$_GET['url']);
curl_setopt($curl_handle, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0)");
curl_setopt($curl_handle, CURLOPT_REFERER, "http://google.com");
curl_setopt($curl_handle,CURLOPT_CONNECTTIMEOUT,2);
curl_setopt($curl_handle,CURLOPT_RETURNTRANSFER,1);
$buffer = curl_exec($curl_handle);
curl_close($curl_handle);
echo $buffer;
?>
所以,我会作出像一个AJAX请求:
/spider.php?url=http://target.com
它返回一个空字符串。我知道这是设置正确,但因为如果我切换目标与twitter.com它的作品...我错过了什么使它看起来像一个完整的浏览器?
设置[卷曲](HTTP:/ /www.php.net/curl)? – BoltClock 2010-07-24 06:11:32
我正在使用cURL – 2010-07-24 06:23:27