1
A
回答
1
当然,只需在全局内存中创建一个缓冲区并从第一个内核写入缓冲区,然后在第二个内核执行过程中读取缓冲区。
相关问题
- 1. OpenCL Gemm内核本地内存变慢
- 2. 多个OpenCl内核
- 3. 在多个GPU上运行OpenCL内核?
- 4. OpenCL - 本地内存效率
- 5. OpenCL本地工作本地内存
- 6. 这是OpenCL内核的合适内存?
- 7. OpenCL:防止内核缓存
- 8. opencl中的多个内核调用
- 9. OpenCL,多工作组/内核?
- 10. 在OpenCL内核
- 11. 发布Opencl内存,内核,设备等
- 12. 从另一个OpenCL内核调用OpenCL内核
- 13. OpenCL的本地内存声明
- 14. OpenCL变量或内核成本内存中的数组?
- 15. OpenCL内核参数
- 16. OpenCL内核参数
- 17. 杀死OpenCL内核
- 18. 剖析OpenCL内核
- 19. 优化opencl内核
- 20. opencl - 内核限制
- 21. OpenCL内核问题
- 22. 调试OpenCL内核
- 23. opencl设备信息,本地内存量
- 24. OpenCL内核在Nvidia GPU上使用多少寄存器?
- 25. 如何在程序内部的OpenCL中启动多个内核?
- 26. 内核中的Opencl循环
- 27. 的OpenCL内核+ ClMagma阵列
- 28. OpenCL内核的优化
- 29. 在OpenCL的另一个内核中使用内核结果
- 30. 内核OpenCL没有保存结果?
这就是我想要避免的事情,我会将GPU生成的数据写入设备的本地内存,因为我读过这样会更快,并且导致GPU生成的数据永远不会被主机使用 - 应用程序本身。 – Soxda2
@ Soxda2全局内存位于设备上,本地内存只是每个工作组只能访问的内存。 –
好的,谢谢! – Soxda2