2011-09-25 31 views
0

我从Curl/php开始,我非常喜欢它可以做的事情。虽然,我被封锁了几天,我真的需要帮助。如何从论坛主题获取数据?

有一些特殊的数据需要用另一个脚本来抓取和处理,这要感谢txt文件。

数据是由我的论坛上发布的代理,代表同意发布在与论坛相关的外部网站上。

的代理正在这种形式

107.2.178.129:47535<br/>173.174.251.89:18785<br/>173.48.224.237:1807<br/>and so on ... 

我需要它们被放置在一个文本文件,每行一个代理。

这里是我迄今为止

<?php 


$ch = curl_init(); 

curl_setopt($ch, CURLOPT_URL, 'http://www.external-site.com/Members/Login.php'); 

curl_setopt ($ch, CURLOPT_POST, 1); 

curl_setopt ($ch, CURLOPT_POSTFIELDS, 
'fieldname1=fieldvalue1&fieldname2=fieldvalue2'); 

curl_setopt ($ch, CURLOPT_COOKIEJAR, 'cookie.txt'); 

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

$store = curl_exec ($ch); 

curl_setopt($ch, CURLOPT_URL, 
'http://www.external-site.com/index.cgi?action=display&thread=26'); 

$content = curl_exec ($ch); 

curl_close ($ch); 

?> 

在那之后我被困。

+1

为什么你不要求网站的所有者提供一些方便的格式的数据? – zerkms

回答

3

所以,你已经获得论坛帖子文本?假设$content是有效的:

file_put_contents('proxies.txt', implode('\n', explode('<br/>', $content))); 

使用\n在Linux或\r\n在Windows上。