我尝试使用OpenMP编写简单的应用程序。不幸的是我有加速问题。 在这个应用程序中我有一个while循环。这个循环的主体由一些应该按顺序执行的指令和一个用于循环的指令组成。我使用#pragma omp parallel for
来使这个循环并行。这个循环没有太多的工作,但经常被调用。OpenMP - 只创建一次线程
我准备了for循环的两个版本,并在1,2和4内核上运行应用程序。
版本1(for循环中的4次迭代):22sec,23sec,26sec。
版本2(for循环中的100000次迭代):20sec,10sec,6sec。你可以看到,当for循环没有太多的工作时,2核和4核的时间高于1核。 我想原因是#pragma omp parallel for
在while循环的每次迭代中创建新线程。所以,我想问你 - 有没有可能一次创建线程(在while循环之前),并确保while循环中的某些作业将按顺序完成?
#include <omp.h>
#include <iostream>
#include <math.h>
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
int main(int argc, char* argv[])
{
double sum = 0;
while (true)
{
// ...
// some work which should be done sequentially
// ...
#pragma omp parallel for num_threads(atoi(argv[1])) reduction(+:sum)
for(int j=0; j<4; ++j) // version 2: for(int j=0; j<100000; ++j)
{
double x = pow(j, 3.0);
x = sqrt(x);
x = sin(x);
x = cos(x);
x = tan(x);
sum += x;
double y = pow(j, 3.0);
y = sqrt(y);
y = sin(y);
y = cos(y);
y = tan(y);
sum += y;
double z = pow(j, 3.0);
z = sqrt(z);
z = sin(z);
z = cos(z);
z = tan(z);
sum += z;
}
if (sum > 100000000)
{
break;
}
}
return 0;
}