2011-12-13 64 views
1

我正在寻找一个可以管理分布式计算环境中大规模工作流程的开源资源管理器。 我对TORQUE,SLURM,LOADLEVELER进行了调查,在处理大型节点时SLURM比TORQUE要好,但是在单个集群中。所有这些都用于批处理系统。 Condor用于网格环境,但提供粗粒度分布式对齐。 我觉得Ganglia和Nagios在高性能计算环境中很出色。但是我想知道Ganglia和Nagios是否可以用于Workflows?可以在调度程序中嵌入我的调度算法,并通过Hadoop MapReduce Framework上的资源管理器使用它? 有用的回复更多赞赏。 谢谢。资源管理器处理跨异构系统的大规模工作流程

回答

2

Ganglia和Nagios是监控工具,他们不会给你一个资源管理。检出最新的Hadoop。它在内部附带资源管理。

新的ResourceManager管理计算的全球分配 资源,应用程序和每个应用程序ApplicationMaster 管理application,Äôs调度和协调。

http://hadoop.apache.org/common/docs/r0.23.0/