我正在Scrapy显示分页列表的项目的Scrapy ASP.net页面。要通过项目定位,有下面的格式下一个和上一个按钮:刮ASP.NET页 - 下一步按钮单击
<form name="aspnetForm" method="POST" action="search_active_main.aspx" id="aspnetForm">
<!-- other content here -->
<!-- previous button -->
<input type="image" name="ctl00$gvMain$ctl01$btnPrevious" id="ctl00_gvMain_ctl01_btnPrevious" src="/image/previous.gif" />
<!-- next button -->
<input type="image" name="ctl00$gvMain$ctl01$btnNext" id="ctl00_gvMain_ctl01_btnNext" src="/image/next.gif" />
<!-- other content here -->
</form>
当你点击一个按钮,像这样被发送作为POST的一部分:
ctl00$gvMain$ctl01$btnNext.x:37
ctl00$gvMain$ctl01$btnNext.y:10
这些数字代表什么/我如何在不使用硒之类的情况下抓取它们?
这些数字看起来代表坐标。尝试单击按钮的最左上角,查看发送了哪些数据。考虑到两个合作伙伴的价值较低,我希望你能看到接近x:0 y:0的东西(取决于你点击的角度有多接近)。 –
感谢这是正确的,在这种情况下,这些数字与如何抓取页面无关。 – jyek