我想从下面的网址刮取数据。但硒driver.get(url)
失败有时错误是[Errno 104] Connection reset by peer
,有时[Errno 111] Connection refused
。 在罕见的日子里,它工作得很好和我的Mac与真正的浏览器相同的蜘蛛工作正常每一次。所以这和我的spider
没有关系。硒无头浏览器webdriver [Errno 104]连接重置由对端
已经尝试了许多解决方案,如等待页面上的选择器,隐式等待,使用硒请求哟传递适当的请求标头等,但似乎没有任何工作。
http://www.snapdeal.com/offers/deal-of-the-day
https://paytm.com/shop/g/paytm-home/exclusive-discount-deals
我使用python
,selenium
& headless Firefox webdriver
实现这一目标。操作系统是centos 6.5
。
注意:我有很多AJAX
成功刮下一些重页,有些在下面。
http://www.infibeam.com/deal-of-the-day.html, http://www.amazon.in/gp/goldbox/ref=nav_topnav_deals
已经花了很多天试图调试的问题没有运气。任何帮助,将不胜感激。
救了我很多的期待 - 谢谢。你的意思是 – SteveJ