2012-10-11 77 views
0

以下代码的Html输出提供了一些其他数据,这些数据在页面中根本不可用。我将这个输出与视图页面源进行比较。额外的数据,从开始“找不同......”PHP内容:html内容的curl_exec()与视图页面源不同

$url : http://www.linkedin.com/pub/senthil-selvaraj/36/90b/5b9 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL,   "$url"); 
curl_setopt($ch, CURLOPT_TIMEOUT,  30); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER,false); 
curl_setopt($ch, CURLOPT_COOKIEJAR,  "cookie.txt"); 
curl_setopt($ch, CURLOPT_USERAGENT,  "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)"); 

if ($proxystatus == 'on') 
{ 
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); 
    curl_setopt($ch, CURLOPT_HTTPPROXYTUNNEL, TRUE); 
    curl_setopt($ch, CURLOPT_PROXY, $proxy); 
}    

$body = curl_exec($ch); 

回答

0

这是最有可能连接到cookie或标题,如卷曲并不适用于所有的方式模拟真实的浏览器。因此,您的输出可能会有所不同,因为cURL甚至可以发送不同的Accept或Location标头等。

您是否尝试了不同的浏览器?另外,该卷曲是否从您正在浏览页面的相同IP出发?

编辑:什么,你可以尝试做的是安装Firebug到Firefox,然后使用F12键打开它,切换到网络(或网络)选项卡,并检查什么标头浏览器向服务器发送。然后,您可以使用您的cURL请求来模拟这些标题。

+0

除了页面信息,curl_exec还在输出中添加了建议信息。输出显示包含senthil selvaraj名称的许多其他url。 – Muzaffer

+0

我明白,但你能回答这2个问题吗? –

+0

我没有尝试与其他浏览器,但相同的IP – Muzaffer