我正在使用Python进行网络爬行。我在使用Python版本3时遇到了问题。所以我想知道哪个版本的Python适合于网页爬行。要使用BeautifulSoup和urllib的哪个Python版本?
回答
我认为,转向Python 2.7肯定有反驳的理由。我没有理由想到,特别是对于网络爬行,你需要恢复到Python 2.7。
BeautifulSoup 4和lxml都完全移植到Python 3.5。
urllib在Python 3.5中完全可用。你应该知道在Python 2.7和Python 3.5中有urllib的differences in the implementation。
但是,我建议你使用Requests包而不是urllib。这里是一个post突出他们的一些差异。
如果您需要加载需要JavaScript的页面,Selenium也适用于Python 3.5。 Selenium也可以支持无头浏览(例如PhantomJS)。
另外,这里有一个来自Python的官方post,可以帮助你引导你的决定。
谢谢:)我将彻底查看这些链接。 – ash1234
如果你选择安装的标准Python发行之一, 请确保您有Python的2.7.3或更高版本,但不使用Python 3.0或更高版本 ;这些版本当然是最前沿的版本,但是我们将使用的许多软件包还没有支持Python 3.X ,直到他们这样做,3.X并没有那么吸引人。对于一个好的 讨论Python 3.X的内容和不可用的内容,请参阅选择 Python版本。
得到了这个website,介绍和讨论了Python的网络cralling。我建议你接受他们的建议。我也经历过Python 2.7。*是目前应用程序使用其他软件包的最佳选择。
- 1. 哪个URLLIB包使用Python
- 2. 使用Python/urllib/beautifulsoup从URL批量下载文本和图像?
- 3. 网络使用beautifulSoup和urllib的
- 4. BeautifulSoup的哪个版本适用于GAE(python 2.5)?
- 5. 本地HTML文件刮擦Urllib和BeautifulSoup
- 6. 要使用哪个版本的JBoss AS?
- 7. 要使用哪个版本的导轨
- 8. 要使用哪个版本的Hadoop API
- 9. 使用urllib和BeautifulSoup从Python中检索信息
- 10. 应该使用哪个版本的Python?
- 11. __future__ import with_statement需要哪个python版本?
- 12. 要学哪个python版本? (noob问题)
- 13. 如何告诉python要使用哪个版本的libmysqlclient.so?
- 14. MySQL要使用哪个版本?
- 15. 要使用哪个hadoop版本?
- 16. 要使用哪个SQL Server 2008版本
- 17. 推荐odoo使用哪个python版本?
- 18. 使用beautifulsoup和python
- 19. Python 3 | PyQt5 - QWebEngineView + urllib + beautifulsoup与Cookies
- 20. 要使用哪个版本的CXF和spring?
- 21. 决定使用哪个python版本用于点和easy_install
- 22. 蟒蛇 - 网页抓取BeautifulSoup和urllib的
- 23. Urllib和BeautifulSoup灵活的urlopen()选项
- 24. 我应该使用哪个urllib属性来代替Pycharm版本4.5.4中的urllib.quote()?
- 25. 哪个版本的Python用于schemacrawler
- 26. 用Python-BeautifulSoup和urllib网页抓取一个奇怪的html安装程序
- 27. Python和Gtk--正在使用哪个GTK版本?
- 28. Python和urllib
- 29. 机械化,urllib,beautifulsoup和相对路径
- 30. 要使用哪种Spring&Hibernate版本
尝试版本2.7,这适用于大多数应用程序版本。 –