这有点棘手。据我猜测,这个网页使用某种AJAX来根据搜索查询提取内容。当我使用Perl获取页面时,它会获取php/html后面的脚本代码,但不会获取手动搜索查询时显示的结果。我需要能够获取结果页面的内容。无论如何要在Perl中做到这一点?如何使用Perl动态获取网页内容?
2
A
回答
6
在Perl中查看Selenium RC和WWW::Selenium
模块。有了它们,你可以控制一个真正的网络浏览器
另一个选项是WWW::HtmlUnit
,它使用HtmlUnit Java库在没有Web浏览器的情况下执行JavaScript。 WWW::HtmlUnit
使用Inline::Java为Perl提供对该库的访问权限。我发现在安装时,最好对“你是否想构建JNI扩展?”这个问题说“不”。
3
如果你正在编写需要检查渲染页面的测试,你可以看看Schwern的javascript-tap-harness,它适用于Selenium并处理所有的脚手架。
我也发现Using WWW::Selenium To Test Or Automate An Ajax Website很有用。
相关问题
- 1. 如何使用java获取动态网页内容?
- 2. 使用Nutch如何抓取uisng ajax网页的动态内容?
- 3. python如何获取网页的所有内容动态
- 4. 如何使用Perl访问JavaScript驱动的网页的内容?
- 5. 使用Php获取网页内容
- 6. 使用LWP获取网页内容
- 7. 网页抓取动态内容与Python
- 8. 网页抓取动态内容
- 9. 如何获取网页内容(android)?
- 10. 如何获取网页的txt内容?
- 11. 如何获取HTTPS网页的内容?
- 12. 动态网页内容
- 13. PHP获取网页内容
- 14. 获取网页内容
- 15. 使用ng-view获取动态内容?
- 16. 如何使用Perl从JavaScript动态生成的网页中获取文本?
- 17. 使用clojure抓取动态内容的网页
- 18. 如何使用TCPDump获取网页内容?
- 19. 如何在登录后使用HtmlAgilityPack获取网页内容?
- 20. 如何使用node.js获取网页内容
- 21. 如何使用Go获取网页内容到字符串
- 22. 如何读取/解析动态生成的网页内容?
- 23. 如何从网页中提取动态AJAX内容
- 24. 解析与beautifulsoup网页获取动态内容
- 25. 用javascript动态内容下载网页
- 26. 如何在访问该网页之前获取网页内容
- 27. 使用PHP/CURL获取(动态加载页面)内容?
- 28. 获取动态svg内容
- 29. 如何从网站获取JavaScript动态内容
- 30. 用于获取网页内容的Javascript?