我想抓一个基本的asp.net目录网站,它有分页。用分页刮去ASP.NET网站
该网站有超过50个页面,每页最多可包含10个分页链接。
我使用fiddler来帮助复制使用浏览器发布的所有参数,变量,表单域,cookie等。我在两个帖子之间看到的唯一区别是__EVENTVALIDATION
值。
使用HttpWebRequest我总是有相同的价值,而通过浏览器更改每次点击。
使用HttpWebRequest我正确地获得了10个第一页,但接下来的所有页面都将我重定向到主页。贝娄发布的JavaScript后面的第一个10后的链接总是相同的。
javascript:__doPostBack('CT_Main_2$gvDirectorySearch$ctl53$ctl00$ctl11','')
任何想法为什么__EVENTVALIDATION
不会改变HttpWebRequest?
可能重复http://stackoverflow.com/questions/2449328/how-do-i-scrape-information-off -asp-net-websites-when-paging-and-javascript-links –
不幸的是,它不是同一个问题。如果你注意到我的情况,我没有:__ doPostBack('gvEmployees','Page $ 2')“> 2页面2的参数。我相信页面之间的差异是通过EventVValidation字段 – Jim