2011-05-19 51 views
5

我有一个cuda代码,我已经实现了几个C2C 2D FFT。他们都使用相同的计划,但出于某种原因,二维FFT的时间很长,而且看起来差别很大。相同的数据大小FFT似乎需要从0.4s到1.8s的任何地方是“2D fft”与两个1D fft相同吗?

这是为1920x1080 FFT。那些时代看起来合理吗?

无论如何 - 我对使用CUDA 1-D批处理的快速FFT有很好的经验。在行上进行一维FFT,然后在矩阵的列上再次进行一次FFT以获得与此二维FFT相同的结果是相同的?我曾经在1D FFT的较大数据集的几秒钟内发生过FFT,所以我希望能够修复其中的一些结果。

谢谢

+1

请记住,这里还有一个隐含的变换会在这里,他的访问模式可以大大放慢改革的步伐。 – 2011-05-19 15:44:27

+0

这些时间非常高--2.67 GHz Core i7上的FFTW会在<100 ms内完成这些工作。 – 2011-05-19 15:51:32

回答