0
A
回答
2
除非在同一路径下的所有员工中都有相同的文件,否则无法加载本地文件。例如,如果要读取spark中的data.csv文件,请将此文件复制到同一路径下的所有worker(例如/tmp/data.csv)。现在你可以使用sc.textFile(“file:///tmp/data.csv”)来创建RDD。
当前工作目录是您已启动pyspark的文件夹。您可以使用ipython启动pyspark并运行pwd命令来检查工作目录。 [在spark-env.sh中设置PYSPARK_DRIVER_PYTHON =/path/to/ipython以使用ipython]
相关问题
- 1. 如何让UITableView显示当前项目?
- 2. Emacs:如何在框架栏中显示当前目录?
- 3. 如何只显示当前目录和git分支?
- 4. 如何设置node.js终端以始终显示当前目录
- 5. 如何显示不在当前目录中的图像
- 6. 当前目录显然不是当前目录
- 7. SQL Plus:如何更改目录并显示当前工作目录
- 8. 为什么QFileDiaglog方法目录不显示当前目录?
- 9. 如何显示当前周?
- 10. 如何显示当前值?
- 11. 当前目录
- 12. 查找当前目录和子目录包括当前目录
- 13. 如何更改我的tcsh提示以显示我当前的工作目录?
- 14. 命令提示符在提示符前不显示当前目录
- 15. Pyspark:显示
- 16. 在当前目录
- 17. 从当前目录
- 18. 的Git显示当前参考目录中的文件到上面的目录
- 19. 如何让dirent忽略当前目录?
- 20. 如何更改当前工作目录
- 21. 如何获得当前工作目录
- 22. 如何更改SBCL的当前目录?
- 23. 如何使os.walk改变当前目录
- 24. 如何指定Docker的当前目录?
- 25. 如何获取当前用户目录?
- 26. AllFileSelector。如何排除当前目录
- 27. 如何设置当前工作目录?
- 28. 如何“选择”当前目录?
- 29. 如何获取当前目录?
- 30. 显示当前数据库记录