2016-06-28 56 views
5

我有我的程序减少到下面的例子分段错误:为什么MPI_Barrier导致C++

#include <mpi.h> 

int main(int argc, char * argv[]) { 
    int rank, size; 

    MPI_Init(&argc, &argv); 
    MPI_Comm_rank(MPI_COMM_WORLD, &rank); 
    MPI_Comm_size(MPI_COMM_WORLD, &size); 
    MPI_Barrier(MPI_COMM_WORLD); 
    MPI_Finalize(); 
    return 0; 
} 

我编译和运行代码,并得到以下结果:

My-MacBook-Pro-2:xCode_TrapSim user$ mpicxx -g -O0 -Wall barrierTest.cpp -o barrierTestExec 
My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec -n 2 ./barrierTestExec 

================================================================================== = 
= BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES 
= PID 21633 RUNNING AT My-MacBook-Pro-2.local 
= EXIT CODE: 11 
= CLEANING UP REMAINING PROCESSES 
= YOU CAN IGNORE THE BELOW CLEANUP MESSAGES 
=================================================================================== 
YOUR APPLICATION TERMINATED WITH THE EXIT STRING: Segmentation fault: 11 (signal 11) 
This typically refers to a problem with your application. 
Please see the FAQ page for debugging suggestions 

如果我注释掉了MPI_Barrier,或者只在一个节点上运行程序,代码运行良好。我使用了以下编译:

My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec --version 
HYDRA build details: 
Version:         3.2 
Release Date:       Wed Nov 11 22:06:48 CST 2015 
CC:        clang  
CXX:        clang++  
F77:        /usr/local/bin/gfortran 
F90:        /usr/local/bin/gfortran 
Configure options:      '--disable-option-checking' '--prefix=/usr/local/Cellar/mpich/3.2_1' '--disable-dependency-tracking' '--disable-silent-rules' '--mandir=/usr/local/Cellar/mpich/3.2_1/share/man' 'CC=clang' 'CXX=clang++' 'FC=/usr/local/bin/gfortran' 'F77=/usr/local/bin/gfortran' '--cache-file=/dev/null' '--srcdir=.' 'CFLAGS= -O2' 'LDFLAGS=' 'LIBS=-lpthread ' 'CPPFLAGS= -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -D_REENTRANT -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpi/romio/include' 
Process Manager:       pmi 
Launchers available:      ssh rsh fork slurm ll lsf sge manual persist 
Topology libraries available:   hwloc 
Resource management kernels available: user slurm ll lsf sge pbs cobalt 
Checkpointing libraries available:  
Demux engines available:     poll select 


My-MacBook-Pro-2:xCode_TrapSim user$ clang --version 
Apple LLVM version 7.3.0 (clang-703.0.31) 
Target: x86_64-apple-darwin15.5.0 
Thread model: posix 
InstalledDir:  /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin 

这似乎是它应该是一个很重要的问题,但我似乎无法弄清楚。为什么MPI_Barrier会导致这个简单的代码发生故障?

+0

我无法复制。您的代码在这里运行时不会崩溃。 – amaurea

+0

我并不感到惊讶,这是MPI的一个简单的例子,但是无论我有什么编译器组合或什么都不合作。我只是希望有人可能以前见过这个。 – jboss

+0

欢迎来到SO。虽然你的问题被问及,但仍难以重现,从而理解你的问题。可能的答案是*您的MPI安装有问题*,但这不是太有用。你可以添加一些关于你如何安装MPI的细节?最终向包提供商提供的错误报告(假设它来自存储库)可能会更有前途。 – Zulan

回答

0

很难决定你的安装有什么问题。不过,如果你可以使用任何MPI口味,也许你可以试试这个:

http://www.owsiak.org/?p=3492

我只能说,它的工作原理与Open MPI

~/opt/usr/local/bin/mpicxx -g -O0 -Wall barrierTestExec.cpp -o barrierTestExec 
~/opt/usr/local/bin/mpiexec -n 2 ./barrierTestExec 

和也不例外我案件。它确实似乎是环境特定的。

相关问题