我需要在网页上做一些屏幕抓取,其中我需要的内容是由AJAX生成的。在最初的页面上有一个包含4个选项卡的表格。当您单击任何选项卡时,表格的内容会发生变化。我只需要第三个标签中的内容。 我已经使用google chrome'Inspect Element'工具来查看请求和发布数据是什么,并且我可以在将信息(会话ID和许多其他cookie数据以及发布数据)从检查元素结果到PHP curl请求。但这只适用于会议持续的30分钟。有谁知道我可以获取这些信息的方式吗?从AJAX/Javascript网页抓取内容
0
A
回答
0
最后我用htmlunit来获取我需要的内容。我还发现HTMLUnit Scripter对于帮助生成所需的Java代码非常有用。
0
我不会重现这里的代码,但我会指出你的答案。这本书中 它:
http://www.amazon.com/Webbots-Spiders-Screen-Scrapers-Developing/dp/1593273975/ref=dp_ob_image_bk
A必须买的人做你做的事情。
相关问题
- 1. node-simplecrawler:ajaxed内容网页抓取问题
- 2. 网页抓取动态内容与Python
- 3. API Json输出 - 抓取网页内容
- 4. 语言的网页抓取JavaScript内容
- 5. 抓取GWT中网页的内容
- 6. 网页抓取动态内容
- 7. 从C#网站抓取内容#
- 8. 网站内容抓取
- 9. 从html页面抓取内容
- 10. 为什么pipelines.py无法保存从网页抓取的内容?
- 11. 使用jQuery从另一个网页抓取内容
- 12. 从webhook wordpress抓取内容?
- 13. 从网页抓取文本
- 14. 抓取网页,但需要javascript查看页面内容
- 15. 需要帮助的网页抓取 - 获取特定的内容...
- 16. 从前两页抓取网页内容并使用python和BS4将抓取的数据导出到csv
- 17. 抓取整个网站内容
- 18. 建议使用抓取网站内容
- 19. Web动态javascript内容抓取网站
- 20. Perl网页抓取工具,从DIV中提取内容只有“风格”标签?
- 21. PHP:如何从网站源页面提取内容或抓取数据集
- 22. 抓取:内容后
- 23. Nutch不抓取页面内容
- 24. 从网页抓取资源网址
- 25. 从网站抓取多个网页
- 26. 网页抓取从3GPP网址
- 27. 从网站抓取多个网页
- 28. 从iframe页面抓取网页
- 29. 从抓取的网页中提取值
- 30. Beautifulsoup网页抓取
谢谢Aaron,我会检查一下。 –