CUDA在各处都有大量文档和指南,但我一直无法找到的是如何诊断编译内核的任何形式的指令,但会得到诸如此类的模糊的错误消息作为超出正常范围的“未指定的启动失败”“这些块/网格结构是否有意义?等诊断CUDA内核问题
我可以以某种方式拦截cubin文件,并对内存结构等做一些静态分析?原谅我的不高兴,但我无法在任何地方找到任何明确的白痴指南。
祝大家周末愉快。
我正在寻找
- 如何分离出的cubin中间文件
- 做什么用它之后制定出了什么事情,特别是注册和内存配置,看看我的代码违反了任何硬件要求,或者如果我在某处错过了一个错误的错误。
对于任何人碰到这个未来更高版本(我似乎已经创建,使保持显示在我自己的查询个月后......问题的习惯)CUDA-Memcheck给出更有趣的反应是,“检查错误”处理。例如
========= Error: process didn't terminate successfully
========= Invalid __global__ write of size 4
========= at 0x00000040 in decomp
========= by thread (1,0,0) in block (0,0,0)
========= Address 0x00101024 is out of bounds
=========
========= ERROR SUMMARY: 1 error
我甚至没有解释该错误信息......
所以我认为我们回答了第1部分,CUBIN文件。第2部分可能取决于你在做什么。你能举出一个你遇到这些错误的场景的具体例子吗? – 2011-04-16 17:19:13