0
我使用Compute Visual Profiler来测量CUDA程序的性能。Compute Visual Profiler中的CUDA memset
分析器的结果显示了cudaMemset函数的2个不同结果。
- memset32_post
- memset128
我想知道的是这2之间的区别?
我使用Compute Visual Profiler来测量CUDA程序的性能。Compute Visual Profiler中的CUDA memset
分析器的结果显示了cudaMemset函数的2个不同结果。
我想知道的是这2之间的区别?
我猜想,memset128内核做了大部分的工作,因为你使用的大小不是128
的倍数memset32_post内核清理其余的没什么好担心,它只是试图以最有效的方式实现memset,尽管我试图避免memset在内部循环(在任何处理器上)。如果你真的担心这个问题,你可能会超额分配。
谢谢你的回答:) – sgarizvi 2012-03-11 08:13:00