我想以某种复制/粘贴格式从页面获取所有信息,但由于安全限制,我无法使用站点中的urllib或json信息。我想知道是否有方法让python打开网页并复制实际页面本身,而不是从API中检索html代码或JSON?从没有urllib或json的站点获取信息
-3
A
回答
1
您可以通过selenium
加载一个真正的浏览器的网页并获取.page_source
:
from selenium import webdriver
driver = webdriver.Firefox()
driver.get("url")
print(driver.page_source)
1
取决于...你只想使用标准的Python?如果是,则:
另有一个包如selenium
作为另一个答案提到。
相关问题
- 1. 从json sting获取信息
- 2. 如何从没有打开的网站获取信息
- 3. 获取Json信息
- 4. android avd管理器没有从插件站点获取任何信息
- 5. 从Android的网站获取信息
- 6. XPath或Defiant.js和获取节点信息
- 7. 从电影网站获取信息
- 8. facebook链接从网站获取信息
- 9. VBA从网站获取信息
- 10. 使用python从网站获取信息
- 11. c#,从网站获取信息
- 12. 使用Jsoup从网站获取信息
- 13. 从其他网站获取信息
- 14. 从Powershell网站获取信息
- 15. 功能从网站获取信息
- 16. 从树的节点获取信息
- 17. 从url获取json并解析信息
- 18. 使用jquery从json获取信息
- 19. 可以从JSON API获取信息
- 20. 从php多维json中获取信息
- 21. 如何从json获取额外信息?
- 22. 有没有办法使用Adobe Flex获取系统信息或cpu信息?
- 23. 获取Json信息? (Noob)
- 24. 获取JSON信息在Python
- 25. 使用JSON获取信息
- 26. 获取没有WMI的电池信息
- 27. 从网站提取信息
- 28. Reading新信息与urllib的
- 29. 没有从wordpress获取JSON
- 30. R Shiny从scatterD3获取点击信息
你是什么意思_copy实际页面本身_?让浏览器渲染页面? – Finwood
我很好奇你对'实际页面'的定义吗?该页面是html和javascript。 –
[任何人都知道一个好的基于Python的网络爬虫,我可以使用?]可能的重复(http://stackoverflow.com/questions/419235/anyone-know-of-a-good-python-based-web-crawler - 这是我可以使用) – kloddant