我想凑英国食品评级机构数据ASPX SEACH结果页面上scraperwiki(http://scraperwiki.com/scrapers/food_standards_agency/)使用机械化/ Python的,但拿出一个(E,G http://ratings.food.gov.uk/QuickSearch.aspx?q=po30)。问题当试图按照其具有的形式是“下一个”页面链接:Screenscaping ASPX与Python机械化 - JavaScript表单提交
<input type="submit" name="ctl00$ContentPlaceHolder1$uxResults$uxNext" value="Next >" id="ctl00_ContentPlaceHolder1_uxResults_uxNext" title="Next >" />
表单处理程序是这样的:
<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm">
<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" />
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" />
<input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />
的HTTP跟踪时,我手动点击下一步链接显示__e VENTTARGET为空?我可以在其他刮板上找到的所有婴儿床都显示__EVENTTARGET作为处理下一页的方式。
事实上,我不知道我要刮的页面是如何加载下一页的?无论我扔在刮板上,它只会加载第一个结果页面。 (即使能够改变每个页面的结果数量也是有用的,但是我也看不出如何做到这一点)。
所以 - 关于如何刮取1 + N结果页面的任何想法N> 0?