如何在CUDA中分配共享变量?我有一个内核需要在属于特定块的线程之间共享数据。我需要两个名为sid
和eid
的共享变量。我用这样的:在CUDA中分配共享变量
extern __shared__ int sid, eid
,但它给我一个错误,__shared__
变量不能有外部链接。
如何在CUDA中分配共享变量?我有一个内核需要在属于特定块的线程之间共享数据。我需要两个名为sid
和eid
的共享变量。我用这样的:在CUDA中分配共享变量
extern __shared__ int sid, eid
,但它给我一个错误,__shared__
变量不能有外部链接。
有两种方式来分配共享存储器:静态和动态
1,静态
__shared__ int Var1[10]
2,动态:应该添加 “外部” 关键字
extern __shared__ int Var1[]
如果您使用动态方式分配共享内存,则应该设置共享内存si当你调用函数时。例如:
testKernel <<< grid, threads, size>>>(...)
第三段是共享内存的大小。这样所有的共享内存都从同一个地址开始。所以如果你想定义几个共享内存。你应该写如下代码。
__global__ void func(...)
{
extern __shared__ char array[];
short * array0 = (short*)array;
float * array1 = (float*)(&array0[128]);
}
的可能重复的[分配共享存储器(http://stackoverflow.com/questions/5531247/allocating-shared-memory) – talonmies