2011-12-03 39 views
4

我在使用OpenMP一开始,我只是编译gcc -fopenmp openmp_c_helloworld.c下面的一段代码:OpenMP的行为检测CPU和线程

#include <omp.h> 
#include <stdio.h> 
#include <stdlib.h> 

int main (int argc, char *argv[]) { 
    int th_id, nthreads; 
    #pragma omp parallel private(th_id) 
    { 
    th_id = omp_get_thread_num(); 
    printf("Hello World from thread %d\n", th_id); 
    #pragma omp barrier 
    if (th_id == 0) { 
     nthreads = omp_get_num_threads(); 
     printf("There are %d threads\n",nthreads); 
    } 
    } 
    return EXIT_SUCCESS; 
} 

我只是一个四核Intel CPU超线程上运行的可执行文件我得到以下的输出:

Hello World from thread 2 
Hello World from thread 0 
Hello World from thread 3 
Hello World from thread 1 
There are 4 threads 

从技术上讲,我有我的可用CPU和4个CPU核心8线程,为什么OpenMP的显示我只有4个线程?

回答

1

简而言之,我认为这是因为OpenMP寻找CPU(核心)的数量而不是处理器线程的数量。 见this页:`

实现默认 - 通常是一个节点上的CPU数量,虽然 它可以是动态的(见下子弹)。

你可以尝试的一件事是设置你的程序中的线程数量等于处理器线程的数量,看看是否有性能改进(你必须创建自己的基准测试程序)。 在并行编程中,当工作线程的数量等于处理器线程的数量时,获得了良好的性能。您还可以为I/O保留一个或两个额外的线程。