0
我试图编译我的GPU的CUDA C代码与sm_10
体系结构不支持从__global__
功能调用malloc
。malloc替代CUDA内核函数动态内存分配
我需要保留在GPU内存中为其动态创建节点的树。不幸的是,没有malloc
显然我不能那样做。
有没有办法使用cudaMalloc
复制整棵树?我认为这种方法只会复制我的树的根。
我试图编译我的GPU的CUDA C代码与sm_10
体系结构不支持从__global__
功能调用malloc
。malloc替代CUDA内核函数动态内存分配
我需要保留在GPU内存中为其动态创建节点的树。不幸的是,没有malloc
显然我不能那样做。
有没有办法使用cudaMalloc
复制整棵树?我认为这种方法只会复制我的树的根。
引述CUDA C编程指南
全球动态内存分配和操作只能由 计算能力2.x和更高的设备支持。
对于计算能力早于2.0
,唯一的可能性是:
cudaMalloc
从主机端,正如你在__global__
功能需要分配尽可能多的全局存储器;
请问您可以显示您的代码吗? – StormeHawke
你问题的最后一部分不是很清楚。你用_cudaMalloc'_拷贝整棵树是什么意思? 'cudaMalloc'只用于分配内存。你能解释一下为什么你认为'cudaMalloc'你只能复制你的树的根? – JackOLantern