我需要抓取一个网站,但问题是,底部没有链接分页。如果您滚动到底部,数据会附加。现在我怎样才能让我的履带工具发生这种情况?有什么想法吗?如何抓取整个网站,如果数据在滚动后用Javascript追加
0
A
回答
1
尝试检查在向下滚动时执行以追加数据的脚本。它必须以某种方式检索附加数据 - 只要看看它在做什么,并让你的爬虫做同样的事情。
0
使用像Selenium这样的机器人可以工作,您可以在真实的导航器中模拟真实的用户。我曾经在facebook上做过的一件事是在C++/Qt中使用JavaScript解释器,然后通过它发送请求。比Selenium快得多。
我相信Google比你拥有更多的处理能力,网站管理员可以尽其所能解决问题。
相关问题
- 1. 如何在数据库中添加抓取的网站数据?
- 2. 抓取整个网站python
- 3. 如何从网站上抓取数据
- 4. 如果存在重定向,Google bot会抓取整个网站
- 5. 从网站抓取数据
- 6. 从网站抓取数据
- 7. 如何抓取网站?
- 8. 如何追加多个数据库抓取?
- 9. 如何抓取一个网站
- 10. 抓取整个网站内容
- 11. Web动态javascript内容抓取网站
- 12. 如何阻止搜索引擎抓取整个网站?
- 13. 如何检查用户是否在网站上抓取滚动条?
- 14. Ruby on Rails-滚动后如何抓取页面上加载的数据?
- 15. 如何使用scrapy抓取网站?
- 16. NodeJS Xray无法抓取到多个网站来抓取数据
- 17. 使用Python抓取网站后获取特定数据
- 18. 如何使用Python 2从网站上抓取数据?
- 19. 如何使用Jaunt库从网站上抓取数据?
- 20. 如何从使用Java(Android)的网站上抓取数据?
- 21. 如何从抓取工具获取数据到我的网站?
- 22. 如何使用循环来抓取R中多个网页的网站数据?
- 23. 如何通过动态内容加载来抓取网站?
- 24. 我如何从R网站抓取这个网站的信息?
- 25. 如何抓取整个wikimapia?
- 26. 如何使用网页抓取工具获取动态生成的JavaScript数据
- 27. 如何从(javascript?)网站进行网络抓取?
- 28. crawler4j抓取一个网址列表,而不抓取整个网站
- 29. 用c#抓取JavaScript cookie的网站#
- 30. 登录后用cURL从网站抓取数据?
谷歌如何管理这个?谷歌无法检查整个脚本,应该有另一种出路,但我会尝试你的解决方案谢谢:) – user1794257