我想提交一个导入numpy的python文件,但我得到一个no module named numpy
错误。火花提交时没有名为numpy的模块
$ spark-submit --py-files projects/other_requirements.egg projects/jobs/my_numpy_als.py
Traceback (most recent call last):
File "/usr/local/www/my_numpy_als.py", line 13, in <module>
from pyspark.mllib.recommendation import ALS
File "/usr/lib/spark/python/pyspark/mllib/__init__.py", line 24, in <module>
import numpy
ImportError: No module named numpy
我在想我会为numpy -python文件提取一个蛋,但是我很难弄清楚如何生成这个蛋。但后来我发现pyspark本身使用numpy。拉我自己的版本的numpy将是愚蠢的。
任何关于在这里做适当的事情的想法?
尝试安装完整的SciPy或独立的NumPy包,用于您目前使用的Python二进制文件:http://www.scipy.org/install.html – 2015-10-29 02:56:53