我在我的大学为流体动力学模拟设置了一个小型的256核心计算集群。我们使用的代码是用C和Fortran混合编写的,目前运行在大型超级计算机上很好。集群中的混合AMD和Intel节点......考虑因素?
在我们的集群化发展,我们与各16个AMD CPU的16个计算节点。我们还有一个我们想用作“头”或“登录”节点的8核心戴尔盒子。不过,这个盒子是英特尔氙气。
我们想NFS挂载每个用户的主目录登录节点,并限制他们的计算节点的访问。这将要求用户通过登录节点上的mpirun编译和运行他们的程序。我们的问题是:
- 这是可能的这样的混合CPU系统?或者我们会遇到在英特尔编译和在AMD上执行的问题?
- 如果这是一个问题,是否有解决方法?我们能以某种方式让用户在计算节点上透明地编译它们的代码,而只登录到登录节点吗?
- 在具有头节点的集群中,只应通过NFS挂载共享主目录?或者还有其他的目录我们也应该在计算和头节点之间共享?
如果有很好的资源可以帮助,我们也会很感激。我们在各种网页上发现了很多建议和想法......指出社区认为有信誉的社区会很高兴。 (免责声明......我们是不是计算机科学家,我们只是普通的科学家。)
你是邪恶的科学家吗?您使用什么软件来配置和管理群集? – Holly
我们在节点上运行Slackware Linux并使用MPICH2并行运行程序。我们的gcc和gfortran二进制文件在本地编译,以及我们软件所需的库。我们非常乐于接受像Torque这样的管理程序的想法,或者对Linux发行版的改变,如果有强制性的动机去做。 (邪恶的科学家?只有在周末...) –