我想并行化一个100个节点的分布式内存集群中的C串行代码。该集群由25个刀片组成,每个刀片有四个核心,每个都由infiniband组成。在我使用PBS在不同节点之间传播程序的几个串行运行之前。现在我想知道:分布式内存集群的OpenMP或MPI或OpenMPI?
- 什么是在这种情况下OpenMP或MPI或OpenMPI的最佳选择(目前我不想尝试混合的方法,因为我开始学习)?
- 我在哪里可以找到示例/教程?
- 对于一个简单的带有for循环的串行代码,OpenMP/MPI/OpemMPI总是比像PBS这样的排队方法执行得更好吗?
英特尔将OpenMP移植到其“Cluster OpenMP”项目中的分布式内存中(现在已放弃)。主页:https://software.intel.com/en-us/articles/cluster-openmp-for-intel-compilers,论文“将OpenMP扩展到群集”:http://assets.devx.com/goparallel/19403 .pdf HPCWire:http://www.hpcwire.com/2006/05/19/openmp_on_clusters-1/和基准测试[“英特尔集群OpenMP的最初经验”](http://citeseerx.ist.psu.edu/viewdoc /download?doi=10.1.1.87.8887&rep=rep1&type=pdf#page=61) – osgx 2014-05-01 02:49:49