也许我的问题的解决方案是非常明显的。我想用openMP(英特尔至强融核)加速下面的代码,但我不能。如何使用openMP并行化内部循环?
int c=0, d=0, e=0, i;
#pragma opm parallel for private(c, d, e)
for(i=0; i < columns; i++)
{
if((left_side[rule*columns + i] > 0) || (right_side[rule*columns + i] > 0))
{
for(c=0; c < rows; c++)
{
if(left_side[i + c * columns] > 0)
{
if(flag[c] == 0)
{
r_prob[c] = c_vect[c];
flag[c] = 1;
for(d=0; d < columns; d++)
{
switch(left_side[c * columns + d])
{
case 0:
break;
case 1:
r_prob[c] *= M_in[d] * 1.0;
break;
case 2:
r_prob[c] *= (M_in[d] * (M_in[d] - 1)) * .5;
break;
default:
for(e=1; e <= left_side[c * columns + d]; e++)
r_prob[c] *= M_in[d] * 1.0/(e * 1.0);
break;
}
}
}
}
}
}
}
//where r_prob, M_in, left_side, right_side, c_vect and flag are array that are in input.
此代码无法正确运行,r_prob中的值错误。 我如何可以并行化这段代码?
为什么'c','d','e'和最重要的'i'没有在并行循环中声明的具体原因是什么? – Haatschii
我想是因为它是用纯C语言编程的。在C++中,您可以在每个FOR中声明变量 –