官方指导分布式存储说:为星火
如果使用本地文件系统的路径,文件也必须在 工作器节点上相同的路径访问。将文件复制到 所有工作人员或使用网络安装的共享文件系统。
Spark是否需要某种分布式文件系统来进行随机播放?或者我可以复制所有节点上的输入,而不用打扰NFS,HDFS等?
官方指导分布式存储说:为星火
如果使用本地文件系统的路径,文件也必须在 工作器节点上相同的路径访问。将文件复制到 所有工作人员或使用网络安装的共享文件系统。
Spark是否需要某种分布式文件系统来进行随机播放?或者我可以复制所有节点上的输入,而不用打扰NFS,HDFS等?
如果您可以将所有数据复制到所有节点上,为什么您需要Spark?在一台计算机上本地处理数据可能会更快更轻松。只是一个建议。 – kostya