是否可以将Hadoop设置为可以与集群上的其他应用程序良好地配合使用?使用Hadoop共享集群
我熟悉Torque + Maui资源调度程序,并且使用HadoopOnDemand来配置临时Hadoop集群。但是,如果很多人想要使用Hadoop,那会变得非常麻烦:每个人都有同样的设置和拆卸迷你hadoop集群,复制他们自己的HDFS上的和关闭数据的难题等等。
它会如果我们可以有一个永久性的Hadoop实例运行,那么人们可以共享一个总是在运行的HDFS。这需要Hadoop智能地将工作分配给不忙于其他应用程序的节点(比如说R),而不是在排队作业时贪婪。
这可能吗?
不幸的是我认为这是Hadoop在功能方面真正缺乏的地方。 –