2016-02-23 59 views
1

是否可以在虚拟机(VirtualBox)上创建具有多个节点(4或5)的群集,并运行Apache Spark来分析节点内的数据?集群的设计符合HDFS的风格,但不使用HDFS。如果可能的话,你将如何在节点之间分发数据?该项目的想法是显示水平缩放如何工作。使用虚拟机为大数据创建群集?

+0

HDFS或任何分布式或共享的文件系统? – zero323

+0

因此,如果我理解正确,你想创建自己的分布式文件系统并使用它的Apache Spark? – neuromouse

+0

是的,这正是我想要做的,文件系统的设计是“模仿”HDFS的设计。 –

回答

相关问题