我有一个运行两次不同网格大小的内核。CUDA,cuPrintf会导致“未指定的启动失败”?
我的问题是与cuPrintf。内核运行之前我没有cudaPrintfInit()
,内核运行之后没有cudaPrintfDisplay(stdout, true)
和cudaPrintfEnd()
,我没有错误,但是当我把它们放在那里时,出现“未指定的启动失败”错误。
在我的设备代码,只有一个这样的循环打印:
if (threadIdx.x==0) {
cuPrintf("MAX:%f x:%d y:%d\n", maxVal, blockIdx.x, blockIdx.y);
}
我使用CUDA 4.0与CUDA功能的卡2.0所以我编译代码才能使用此语法:
nvcc LB2.0.cu -arch=compute_20 -code=sm_20