2
A
回答
1
CUDA线程代码很大程度上遵循C和C++语法模式。所以,你可以轻松打印出指针的数值在内核代码:
printf("pval = %p\n", my_pointer);
如果你想在一个CUDA内核做这个跨线程,你可以这样做:
__global__ void my_kernel(int *data){
int idx = threadIdx.x+blockDim.x*blockIdx.x;
printf("thread: %d, pointer: %p, value: %d\n", idx, &(data[idx]), data[idx]);
}
或相似。很明显,如果你使用大量的线程,这将创建大量的输出,并且要注意内核printf
使用一个有限大小的缓冲区。
相关问题
- 1. CUDA合并访问全局内存
- 2. CUDA全局内存
- 3. CUDA:存储在全局内存中的地址
- 4. 全局内存和CUDA流
- 5. 全局内存访问
- 6. cuda全局和共享内存访问时间
- 7. CUDA探查器报告全局内存访问效率低下
- 8. CUDA计算能力2.0。全局内存访问模式
- 9. 如何将所有访问指向CUDA中的全局内存?
- 10. 全局内存与CUDA中的动态全局内存分配
- 11. 修改CUDA示例导致对全局内存的不安全访问
- 12. CUDA非法内存访问
- 13. 访问内存地址的内容C
- 14. 在CUDA中写入全局内存
- 15. CUDA Dynamic Parallelism Deferencing全局内存
- 16. CUDA中的全局vs共享内存
- 17. CUDA全局内存事务的成本
- 18. 关于全局内存访问方法
- 19. 共享和全局内存访问
- 20. 使用CUDA尽可能快地访问只读全局数组?
- 21. c中的访问内存地址#
- 22. 无法访问内存地址C++
- 23. 访问32位内存地址c#
- 24. 访问Ninject内核全局
- 25. CUDA - 更好的占用率与更少的全局内存访问?
- 26. CUDA内存分配和访问问题
- 27. 恒忆与纹理内存vs CUDA中的全局内存
- 28. CUDA:内存性能,什么是全局内存带宽
- 29. cuda从全局内存复制数组到共享内存
- 30. CUDA,全局内存或主机内存哪个更快?
谢谢。也许我可以做一些简单的指针算术来查看访问何时“不”合并(例如,非单元跨度等),并将其打印出来。 – algoProg