2016-11-16 28 views

回答

1

我认为,转向Python 2.7肯定有反驳的理由。我没有理由想到,特别是对于网络爬行,你需要恢复到Python 2.7。

BeautifulSoup 4和lxml都完全移植到Python 3.5。

urllib在Python 3.5中完全可用。你应该知道在Python 2.7和Python 3.5中有urllib的differences in the implementation

但是,我建议你使用Requests包而不是urllib。这里是一个post突出他们的一些差异。

如果您需要加载需要JavaScript的页面,Selenium也适用于Python 3.5。 Selenium也可以支持无头浏览(例如PhantomJS)。

另外,这里有一个来自Python的官方post,可以帮助你引导你的决定。

+0

谢谢:)我将彻底查看这些链接。 – ash1234

-2

如果你选择安装的标准Python发行之一, 请确保您有Python的2.7.3或更高版本,但不使用Python 3.0或更高版本 ;这些版本当然是最前沿的版本,但是我们将使用的许多软件包还没有支持Python 3.X ,直到他们这样做,3.X并没有那么吸引人。对于一个好的 讨论Python 3.X的内容和不可用的内容,请参阅选择 Python版本。

得到了这个website,介绍和讨论了Python的网络cralling。我建议你接受他们的建议。我也经历过Python 2.7。*是目前应用程序使用其他软件包的最佳选择。

+0

非常感谢您的快速回复。:) – ash1234

+0

如果这回答您的问题,请将问题标记为可以帮助其他人! –

+0

安娜你的答案是善意的,但我会(礼貌地!)争辩说,现在在2017年,甚至在2016年末,当你发布时,你链接到的那个网站的信息段已过时,无论是在一般情况下还是与关于网络抓取。站点列出的所有软件包(从numpy到ipython的1-7)都可以在Python 3中使用,并且已经有一段时间了。偶尔会出现一些边缘情况,但一般情况下不需要使用2.7,不再需要 – Neil

相关问题