2016-04-04 162 views
1

我正在实现一种使用强制执行的计算图形布局的算法。我想添加OpenMP指令来加速一些循环。在阅读了一些课程之后,根据我的理解,我添加了一些OpenMP指令。该代码已编译,但不会返回与顺序版本相同的结果。OpenMP:在while循环中并行化循环

我想知道你是否会善待我的代码,并帮我弄清楚我的OpenMP版本出了什么问题。

请在这里下载档案: http://www.mediafire.com/download/3m42wdiq3v77xbh/drawgraph.zip

正如你看到的,我想并行代码的部分是:

unsigned long graphLayout(Graph * graph, double * coords, unsigned long maxiter) 

尤其是,这两个环,其消耗很多计算资源:

/* compute repulsive forces (electrical: f=-C.K^2/|xi-xj|.Uij) */  
    for(int j = 0 ; j < graph->nvtxs ; j++) { 
    if(i == j) continue; 
    double * _xj = _position+j*DIM; 
    double dist = DISTANCE(_xi,_xj);   
    // power used for repulsive force model (standard is 1/r, 1/r^2 works well) 
    // double coef = 0.0; -C*K*K/dist;  // power 1/r 
    double coef = -C*K*K*K/(dist*dist); // power 1/r^2 
    for(int d = 0 ; d < DIM ; d++) force[d] += coef*(_xj[d]-_xi[d])/dist; 
    } 

/* compute attractive forces (spring: f=|xi-xj|^2/K.Uij) */ 
    for(int k = graph->xadj[i] ; k < graph->xadj[i+1] ; k++) { 
    int j = graph->adjncy[k]; /* edge (i,j) */ 
    double * _xj = _position+j*DIM; 
    double dist = DISTANCE(_xi,_xj);    
    double coef = dist*dist/K; 
    for(int d = 0 ; d < DIM ; d++) force[d] += coef*(_xj[d]-_xi[d])/dist; 
    } 

预先感谢您提供的任何帮助!

回答

0

您在您的代码中有数据竞赛,例如,在做maxmove = nmove;energy += nforce2;时。在任何多线程代码中,直到您使用原子访问(#pragma omp atomic read/write/update)或直到您明确同步对此类变量的访问(临界区段,锁定)时,才能写入线程共享的变量。首先阅读关于OpenMP的一些教程,代码中存在更多问题,例如

if(nmove > maxmove) maxmove = nmove; 

即使使用atomics,您也必须使用所谓的比较 - 交换原子操作来解决此问题。更好的解决方案是让每个线程计算其局部最大值,然后将其减小到全局最大值。