1
我想使用php curl代码(其中包含数据页面明智)来废弃aspx页面。最初页面使用get方法加载,但是当我们选择页面编号时。从下拉菜单中使用post方法提交页面页面。使用PHP curl刮去aspx页面
我想通过传递postfields来查找特定页面的数据no,但无法做到这一点。
我创建了一个虚拟代码来获取第5页的记录,但它总是返回第一页的结果。
示例代码
$url = 'http://www.ticketalternative.com/SitePages/Search.aspx?catid=All&pattern=Enter%20Artist%2c%20Team%2c%20or%20Venue';
$file=file_get_contents($url);
//<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value=
preg_match_all("#<input.*?name=\"__VIEWSTATE\".*?value=\"(.*?)\".*?>.*?<input.*?name=\"__EVENTVALIDATION\".*?value=\"(.*?)\".*?>#mis", $file, $arr_viewstate);
$viewstate = urlencode($arr_viewstate[1][0]);
$eventvalidation = urlencode($arr_viewstate[2][0]);
$options = array(
CURLOPT_RETURNTRANSFER => true, // return web page
CURLOPT_HEADER => true, // don't return headers
CURLOPT_FOLLOWLOCATION => true, // follow redirects
CURLOPT_ENCODING => "", // handle all encodings
CURLOPT_USERAGENT => "spider", // who am i
CURLOPT_AUTOREFERER => true, // set referer on redirect
CURLOPT_CONNECTTIMEOUT => 120, // timeout on connect
CURLOPT_TIMEOUT => 1120, // timeout on response
CURLOPT_MAXREDIRS => 10, // stop after 10 redirects
CURLOPT_POST => true,
CURLOPT_VERBOSE => true,
CURLOPT_POSTFIELDS => '__EVENTTARGET='.urlencode('ctl00$ContentPlaceHolder1$SearchResults1$SearchResultsGrid$ctl13$ctl05').'&__EVENTARGUMENT='.urlencode('').'&__VIEWSTATE='.$viewstate.'&__EVENTVALIDATION='.$eventvalidation.'&__LASTFOCUS='.urlencode('').'&ctl00$ContentPlaceHolder1$SearchResults1$SearchResultsGrid$ctl13$ctl05=4');
$ch = curl_init($url);
curl_setopt_array($ch,$options);
$result = curl_exec($ch);
curl_close($ch);
preg_match_all('/<a id=\".*?LinkToVenue\" href=\"(.*?)\">(.*?)<\/a>/ms',$result,$matches);
print_r($matches);
任何人都可以帮我这个问题,我在哪里得到错误的,我认为它不会因为在第一次加载页面与GET方法工作,因为我们去网页上的链接,它使用帖子。
我将如何获得特定页号的记录?
问候
由于ASP.NET的ViewState验证,您可能无法进行POST。这是所有表单值的荒谬哈希。 – jrummell 2012-04-23 13:14:33
@ jrummell - 那么可以做些什么来克服呢? – mauzzamali 2012-04-23 13:20:02
您将不得不以某种方式根据您的POST变量(以及您未使用的页面上的变量)重新创建ViewState哈希。我不知道你会怎么做。你有权访问aspx源代码吗?你可以改变它接受GET参数吗? – jrummell 2012-04-23 13:31:50