2
根据http://en.wikipedia.org/wiki/CUDA, 最大x或块的y维度的块的1024 最大z维度64CUDA 2D,3D线程块
莫非我们可以有1024×1024×64个线程每块或者我们可以在一个块中最多有1024 + 64个线程?
根据http://en.wikipedia.org/wiki/CUDA, 最大x或块的y维度的块的1024 最大z维度64CUDA 2D,3D线程块
莫非我们可以有1024×1024×64个线程每块或者我们可以在一个块中最多有1024 + 64个线程?
该限制在最近编程指南的附录G中定义,但答案是512或1024个线程,每个块总计,具体取决于您是否拥有Fermi卡或旧卡。
所以对于费米
blockDim.x * blockDim.y * blockDim.z <= 1024
和GT200/G90/G80 /离子:
blockDim.x * blockDim.y * blockDim.z <= 512
注意其他的资源限制(共享存储器和寄存器),这可能需要块大小是小于限制,取决于代码的复杂性。编程指南中也会详细讨论这一点。
我认为这种混淆是,在手册中它说“最大尺寸”是指该参数*的最大值,但是在每块有多少线程的限制内。 – koan