- 请问下面的代码是否按顺序执行? (我不能将
cudaMemcpy2DArrayToArray()
的设备到设备副本放在stream
中) - 下面的代码是否会异步执行? (
cudaMemcpy2DArrayToArray()
不具有异步对应)
我知道代码样品可以更有效地实施,但是它仅仅意在作为示例。此CUDA代码是否按顺序和异步执行?
for(i=0; i<10; i++)
{
cudaMemcpy2DArrayToArray(dst, src); // device to device copy.
cudaBindTextureToArray(texture_reference, dst, ...) // bind dst to texture.
kernel<<< dimGrid, dimBlock, 0, stream >>>(out) // compute an array.
cudaMemcpy2DToArrayAsync(src_p, out, stream) // copy result to src.
}
我不确定这一点,但可能是你可以使用'cudaMemcpy3DAsync'异步地从阵列复制到阵列。由于'struct cudaMemcpy3DParms'具有源和目标'cudaArray'的字段。 – sgarizvi 2013-05-02 14:38:08