2011-08-25 42 views

回答

3

正如你所知,一个集群是一群联网在一起的计算机。当你有这样的配置,您通常安装和使用下列内容:

  • MPI,进程间通信
  • NFS,有一个网盘可见,并且共享给所有节点
  • NTP,同步的节点的时间,以便您可以比较日志事件和时间戳以从远程节点引导节点,以便每个节点都重新启动并保证良好且统一的安装。
  • 一组群集实用程序,使您的生活更轻松,如分布式ssh可同时在所有节点上执行相同的命令。
  • 任务调度程序或队列管理器(如Condor,LFS或其他)允许您优先处理作业提交并最终测量它们以进行限制/定价。
  • 看门狗,所以如果卡住了,自动重启一个节点。
  • 为UPS软件控制

还有更多(所以在权力的长期损失的情况下自动关机)。所有这些都是MPI的完全补充。 MPI只是流程之间的沟通渠道。 MPI本身并不“制造集群”。

+0

很好的回答,谢谢! – EmpireJones

1

正如您所述,MPI只会提供进程之间的通信。如果不会有多人使用集群,那么您确实不需要其他任何东西(除了在所有节点上启动程序的一些脚本)。

但是,实际上我们很少有我们的个人集群。那时你需要一个调度器。调度程序通常处理作业提交和资源分配,可能还会考虑优先级,用户管理和其他事项,以使您的生活更轻松。