2010-10-20 160 views
0

我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格中获得数字的总和。GPGPU矩阵加法问题

您能指导我如何使用CUDA在GPGPU平台上实现它吗?

+3

什么实施环境? OpenCL,Cuda,DirectX,OpenGL,DirectCompute,Matlab?除非你指定这个问题,我怀疑任何人都可以提供帮助。 – 2010-10-20 18:29:36

回答

1

您必须将所有相邻单元格的值传递给您的内核(作为参数),以便您可以完成总和。 像这样在PARAMETERLIST和代码右后: (INT actualCellvalue,INT ADJ1,INT ADJ2,INT ADJ3 ...)

{ actualCellvalue = actualCellvalue + ADJ1 + ADJ2 + ADJ3 ....; }

这可能是错误的,但多数民众赞成我从你的真的简短说明。

Regards, Peter