2017-08-25 168 views
-2

我已经建立了一个具有1个头节点和3个计算节点的小型集群。我的客户机是用于提交工作簿卸载作业的Windows 2016 Server。我的问题 - HPC非常缓慢;如果我在本地计算机上运行作业,则运行速度比HPC群集上的速度快10倍左右!我节点的配置如下:HPC集群极其缓慢

Headnode:2vCPU和8GB内存

计算节点:1vCPU和4GB内存的每个

我有一个可疑的问题可能是与节点之间的通信网络。或者完全不同的东西。有人可以帮忙吗?

提前致谢!

+0

您是否试过打开和关闭它? – Tom

+0

是的,好几次。 – KMLN

回答

0

从我的HPC工作中来看:由于集群内的互连(网络交换机),我经历了很多性能下降。这可能是因为您的互连速度不够快,无法真正利用硬件。由于数据必须传送到其他节点,因此缓慢互连会阻碍您的速度/性能。目前,大多数HPC系统都具有某种特殊的网络互连,其速度非常快(通常为infiniband),允许节点快速向对方发送数据。我建议你检查一下你的网络交换机,并确保它不低于1千兆位以太网速度。

这里是我的出版物之一的链接:https://www.raspberrypi.org/magpi/benchmarking-raspberry-pi-cluster/

接近年底,你可以看到低以太网带宽如何阻碍了我的集群的性能。