我正在编写运行一堆不同程序的软件(通过twisted'stwistd
);那就是N种各种各样的守护进程必须跨越多台机器启动。如果我手动执行此操作,我将在涉及的机器上运行诸如twistd foo_worker
,twistd bar_worker
等命令。启动和停止群集中的进程
基本上会有一个机器列表和我需要它们运行的守护进程。另外,当需要时,我需要关闭它们。
如果我是从头开始编写这个,我会写会用通过网络进行身份验证的管理员客户端可以访问以下功能在每台机器上永久运行在集群中的“产卵”守护:
- 用给定的命令行启动一个进程。返回一个句柄来管理它。
- 杀死给定句柄的进程。
- (可选)查询类似CPU时间的东西给定句柄。
对上述程序进行编程将是相当微不足道的,但我无法想象这是一个新问题。当然,现在有解决方案来做到这一点?然而,我确实缺乏服务器管理的经验,甚至不知道相关术语是什么。
在Linux集群上有什么现有的方法可以做到这一点,涉及到哪些重要术语?欢迎Python特定解决方案,但不是必需的。
另一种说法是:给定一个局域网中的一堆机器,如何以编程方式将它们作为群集工作?
现在,这就是我称之为高质量的答案。谢谢! – porgarmingduod 2012-07-10 16:19:26