2017-04-04 33 views
1
Pyspark整合

我已经在我的机器上安装蟒蛇(Python的2.7版本),并通过该I”我连接到jupyter笔记本,但无法运行“与“PYSPARK_DRIVER_PYTHON = jupyter”和PYSPARK_DRIVER_PYTHON_OPTS =“记事本”开始jupyter笔记本打印“命令也。当我运行命令时,它将进入下一行但不显示输出,并且打印颜色不会突出显示。与Jupyter

我已经安装了pyspark,并在Windows机器(独立模式)的命令提示符下运行,其工作正常.....但我需要在jupyter笔记本(windows)中运行。有谁能够帮助我??

+0

2更多的黄金您是否遇到了错误?你能在笔记本上创建一个SparkContext吗? –

+0

SparkContext是否关闭? –

+0

完全没有错误,只是不显示输出,仅仅是在运行时它会进入下一行。 –

回答

1

这就是你需要做的所有事情,当你已经有了pyspark外壳正如你刚才提到的那样设置了Pupper和Windows之后,

  1. 添加两个新的环境变量,设置

    • PYSPARK_DRIVER_PYTHON从CMD提示jupyter
    • PYSPARK_DRIVER_PYTHON_OPTS笔记本
  2. 运行pyspark,而不是 'jupyter notebook'

这应该可以解决问题。