我想用一个python框架Scrapy从网站上抓取数据。我可以使用蜘蛛从网站获取数据,但当我尝试浏览网站时会出现问题。网页抓取:自动按钮点击
根据this的帖子Scrapy不能很好地处理Javascript。
此外,正如接受的答案中所述,我不能使用mechanize或lxml。它建议使用Selenium and Scrapy
的组合。
功能按钮:
我通过网站上提供浏览。按钮 的功能是显示更多优惠。所以在点击它时,它会调用一个加载结果的javascript 函数。
我也在看CasperJS and PhantomJS
。他们会工作吗?
我只需要自动点击一个按钮。我如何去做这件事?
真的取决于按钮。你能分享一下细节吗? – alecxe
如果您使用Selenium,则JavaScript将在其他普通浏览器中执行。您当然可以只使用Selenium IDE或WebDriver自动执行简单的按钮点击。 – BadZen