2016-07-15 93 views
2

我试图安装使用pysparkpip install像下面。但我有以下错误。pyspark:PIP安装找不到一个版本

(python_virenv)edamame$ pip install pyspark 
Collecting pyspark 
    Could not find a version that satisfies the requirement pyspark (from versions:) 
No matching distribution found for pyspark 

有没有人有什么想法?谢谢!

回答

2

pyspark是不是在PyPI中,所以你不能直接使用pip install安装它。

相反,你可以在这里下载星火的适当版本:http://spark.apache.org/downloads.html,你会得到一个压缩的TAR文件。然后将其解压缩,pyspark位于其python文件夹中。

要打开星火壳的Python版本,你可以进入你的星火目录,键入:

bin/pyspark 

bin\pyspark 
在Windows

1

PySpark可以通过以下方式安装。

下载火花来自:Spark Downloads

下载并解压缩文件。转至文件夹,并执行

./bin/pyspark 

您可能要添加的bin文件夹在你的shell的$PATH变量为好。

或者,

您可以从CDH分布安装:

+0

谢谢!是否有可能将它添加到我的虚拟环境? – Edamame

+0

你应该可以。我不确定它是否会特别有用。你可以参考cloudera的链接:http://blog.cloudera.com/blog/2015/09/how-to-prepare-your-apache-hadoop-cluster-for-pyspark-jobs/ – srjit

5

从Spark 2.2开始,PySpark现在可以在PyPI中使用。

pip install pyspark


火花2.1,PySpark是一封来自PyPI,这是在考虑用于本ticket 2.2 PIP安装但尚未。要安装PySpark,现在只需要下载Spark 2.1+并运行setup.py:

cd spark-2.1/python/ 
pip install -e . 

非常感谢@霍尔登!

相关问题