0
我有一个CUDA应用程序;在首先为各种阵列分配cuda内存之后,程序循环完成:将数据传输到GPU,在GPU上处理内核,从GPU传回数据。第一个数据集由GPU正确处理并返回。此后的后续数据集生成错误9:无效配置。cuda无效配置错误9
由于我不去或重新分配内存我不相信我内存不足。我已经三重检查了网格和块的尺寸,这些都在范围内:(200,0,0)和(720,20,0)。
还有什么我应该看看,以了解什么是关于配置是无效的?
我需要更清楚:内核调用生成错误9(存储器拷贝是没有错误)。另外,使用Nsight时,内核永远不会收到呼叫;显然,如果配置错误,内核调用永远无法完成。 – JPM