是否有可能使cuda使用在函数外声明的单线程作用域变量(寄存器或本地内存)?Cuda单线程作用域变量
我的大部分设备功能需要使用相同的变量。
我不想将与变量相同的变量作为参数传递给我的所有设备函数,我想在函数之外声明变量。
这可能吗?
我的计算能力是1.2。
编辑:一个例子:
__device__ __local__ int id;
__device__ __local__ int variable1 = 3;
__device__ __local__ int variable2 = 5;
__device__ __local__ int variable3 = 8;
__device__ __local__ int variable4 = 8;
//
__device__ int deviceFunction3() {
variable1 += 8;
variable4 += 7;
variable2 += 1;
variable3 += id;
return variable1 + variable2 + variable3;
}
__device__ int deviceFunction2() {
variable3 += 8;
variable1 += deviceFunction3();
variable4 += deviceFunction3();
return variable3 + variable4;
}
__device__ int deviceFunction1() {
variable1 += id;
variable4 += 2;
variable2 += deviceFunction2();
variable3 += variable2 + variable4;
return variable1 + variable2 + variable3 + variable4;
}
// Kernel
__global__ void kernel(int *dev_a, int *dev_b, int *dev_c) {
id = get_id();
dev_c[id] = deviceFunction1();
}
3个设备功能需要操纵相同的变量。每个变量都依赖于每个线程计算。据我的理解,我不能使用上面的代码,因为我不能声明变量,以便它们对于每个线程都是本地的。
我必须做的,而不是正在申报核函数中的所有变量,然后将指针传递给变量的所有其他功能:
__device__ int deviceFunction3(int* id,int* variable1,int* variable2,int* variable3,int* variable4) {
*variable1 += 8;
*variable4 += 7;
*variable2 += 1;
*variable3 += 2;
return *variable1 + *variable2 + *variable3;
}
__device__ int deviceFunction2(int* id,int* variable1,int* variable2,int* variable3,int* variable4) {
*variable3 += 8;
*variable1 += deviceFunction3(id,variable1,variable2,variable3,variable4);
*variable4 += deviceFunction3(id,variable1,variable2,variable3,variable4);
return *variable3 + *variable4;
}
__device__ int deviceFunction1(int* id,int* variable1,int* variable2,int* variable3,int* variable4) {
*variable1 += *id;
*variable4 += 2;
*variable2 += deviceFunction2(id,variable1,variable2,variable3,variable4);
*variable3 += *variable2 + *variable4;
return *variable1 + *variable2 + *variable3 + *variable4;
}
// Kernel
__global__ void kernel(int *dev_a, int *dev_b, int *dev_c) {
int id = get_id();
int variable1 = 3;
int variable2 = 5;
int variable3 = 8;
int variable4 = 8;
dev_c[id] = deviceFunction1(&id,&variable1,&variable2,&variable3,&variable4);
}
你能否给你的问题添加一个用例的例子?包含变量和\ _ \ _ device \ _ \ _函数的类是否工作? – talonmies 2013-03-10 15:22:43
如果有'__device__'知道它属于哪个线程的方式,但我不认为有这样的事情。 (即使它不能访问寄存器,但它可以访问全局定义的数组作为每个线程的本地变量,即使如此,性能也会降低很多!) – 2013-03-10 15:59:29
没有办法让一个线程CUDA中文件范围的私有变量。特别是,我不相信有办法在PTX中支持它。 – 2013-03-11 09:38:09