我是python的新手,需要您的建议。 我需要获取由php/java/ajax生成的论坛页面的内容。 该代码包含由php/java/ajax添加到页面的所有元素。 是否可以阅读完整的页面源代码? urlopen()只给出原始的源代码。如何使用python获取论坛页面的内容
回答
qt4库集包括webkit引擎。这意味着你可以使用它来首先渲染页面,然后解析生成的HTML。有一个项目,据我所知,这是Google Project Hosting。
而这里是一个link另一个样品,只有qt4。一定要查看评论,他们谈论确保所有ajax内容已经加载。
我喜欢这个解决方案。这对我们的夜间测试也是一个好主意。但当然qt不是一个轻量级的解决方案...我想只是做重要的AJAX调用应该更快。但是如果他需要整个HTML,那么这真的是一个很好的解决方案。 – Andreas
我知道它不是轻量级的。但是你指出来很好。 :-) –
Selenium非常适合您的任务。 这是很酷的图书馆,可用于许多语言(原因including Python)浏览器自动化。
非常感谢大家的评论和有用的链接! 现在我有大量的信息来学习! – user1826398
不知怎的,我看到鬼图书馆是最合适的。 Ghost可以在https://github.com/jeanphix/Ghost.py
- 1. 无论响应类型如何,获取外部页面内容
- 2. 阅读论坛内容
- 3. 回应论坛ID到新页面显示内容?
- 4. BeautifulSoup - 刮着论坛页面
- 5. 将Ning论坛的内容迁移到Drupal论坛?
- 6. 如何从XUL获取内容页面?
- 7. 如何获取页面内容
- 8. 如何从PAMIE获取页面内容?
- 9. 如何获取页面内容?
- 10. 如何使bbPress论坛页面使用自定义页面模板
- 11. 如何在phpbb论坛上的自定义页面上显示子论坛?
- 12. 如何使用PHP获取页面内容的一部分?
- 13. 使用OpenUri,我如何获取重定向页面的内容?
- 14. 如何使用JavaScript获取远程页面的内容?
- 15. 如何使用PHP DOM获取页面样式表的内容?
- 16. Ruby获取页面内容
- 17. 如何获取重定向页面的页面内容?
- 18. 如何获取登录页面后面的网页内容?
- 19. Python 3.6:如何从动态页面获取内容?
- 20. 从非论坛页面登录ASP.NET论坛
- 21. Drupal 6:没有论坛索引页面(高级论坛)
- 22. 获取一个论坛
- 23. 如何使用iframe将Google网上论坛论坛嵌入网页?
- 24. 如何使用cURL获取页面内容?
- 25. 如何使用JQUERY AJAX获取页面特定内容
- 26. 如何从另一个页面使用ajax获取div内容
- 27. 如何使用jquery或ajax获取外部html页面内容
- 28. 如何使用Javascript或JQuery获取页面内容
- 29. 如何使用CSS在页面中获取正文内容
- 30. 用Python编写的论坛?
我想他是指一些JS/AJAX而不是底层的PHP代码之后的网站的HTML代码。 – Andreas
是的,对,一些JS/AJAX后的HTML代码。 – user1826398
你说得对。我删除了我的评论。它们无效...... –