我刮yahoo
搜索结果,但我得到502 => Net::HTTPBadGateway
。究竟是什么导致错误?这是否意味着yahoo
检测到我的机器人并禁止我的IP?以编程方式搜索雅虎
0
A
回答
0
打印Response对象到控制台(我建议awesome_print此),
但其....完全常规的搜索引擎到分组形状,油门或块履带。我不知道如果雅虎这样做,但谷歌肯定做
你可以考虑http://commoncrawl.org代替
0
是的,他们是阻止您的机器人,所有的大搜索引擎有防御,以防止结果页刮。不过,Google和Bing都提供了一个免费的搜索API,您可以使用它来提供您的机器人。
相关问题
- 1. 雅虎新闻搜索API
- 2. 如何以编程方式登录到雅虎网站
- 3. 雅虎BOSS API:相关搜索
- 4. 如何从雅虎本地搜索
- 5. 搜索雅虎答案使用Jsoup
- 6. 雅虎财经。按名称搜索
- 7. 在雅虎使用java搜索
- 8. 安卓谷歌和雅虎搜索EditText
- 9. 使用雅虎搜索API的问题
- 10. 以编程方式搜索网页?
- 11. 以编程方式运行Outlook搜索
- 12. OpenOffice搜索表以编程方式
- 13. 如何以编程方式搜索jqgrid
- 14. 以编程方式搜索图片
- 15. 以编程方式搜索查询
- 16. 以编程方式搜索+替换.doc
- 17. 如何从雅虎爱尔兰或雅虎印度搜索结果,使用YQL
- 18. 雅虎财经搜索股票代码API /方法
- 19. 如何编写表单以从雅虎财务获取搜索结果?
- 20. 以编程方式阅读PDF嵌入式搜索索引
- 21. 优雅的搜索方式(PHP + MySQL)
- 22. 雅虎地址簿检索
- 23. 雅虎索引脚本
- 24. 登录雅虎邮箱编程
- 25. 编程雅虎邮箱导航
- 26. 检索使用雅虎和Bing搜索的链接
- 27. 我可以使用setProgress以编程方式更改搜索栏:
- 28. 雅虎股票API格式
- 29. 如何使像雅虎新闻网站搜索的搜索功能
- 30. 如何使用雅虎搜索API搜索特定的文件类型?
当您在浏览器中提出请求时,您会看到什么?为什么雅虎? – pguardiario 2012-08-02 08:51:11
最好从Google开始 – emaillenin 2012-08-02 10:01:10