cufft

    0热度

    1回答

    我在Ubuntu 16.04上使用CUDA 7.5 SDK,通过nvidia-cuda-toolkit包安装。我正在尝试使用cuFFT的回调函数编译一个简单的测试程序;该示例的源代码是available at GitHub。 Following the instructions for compiling with the callback feature,我编译源为可重定位的装置代码和链接对li

    2热度

    1回答

    根据该文档时,cufftSetStream()功能 相关联的CUDA流与CUFFT计划。在计划执行期间所做的所有内核启动现在都通过关联的流[...直到...]完成,流将通过另一次调用cufftSetStream()进行更改。 不幸的是,结果变成垃圾。下面是一个例子,它通过两种方式执行一系列转换来演示:一种是每个流有自己的专用计划,另一种是单个计划被重用,如上面的文档所示。前者的行为如预期,重用/

    2热度

    1回答

    在Matlab中,当我输入复数的一维数组时,我输出的数组具有相同大小和相同维数的实数。 试图在CUDA C中重复此操作,但具有不同的输出。 你能帮忙吗?在Matlab中,当我进入IFFT(阵列) 我arrayOfComplexNmbers: [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

    1热度

    1回答

    我正在使用cuda版本7.5 cufft来执行一些FFT和反FFT。 使用cufftExecC2R(.,.)函数执行逆FFT时,我遇到了问题。 其实,当我在cufftPlan1d(,)中使用batch_size = 1时,我得到了正确的结果。但是,当我增加批量大小时,结果不正确。 我正在粘贴一个示例代码来说明这一点。我很快就创建了这个代码,请忽略代码的脏乱。 #include <cufft.h>

    0热度

    1回答

    对于某些图像处理,我使用的是CUDA 7.0和nVidia 980 GTX。在特定的迭代中,通过15-20内核调用和多个cuFFT FFT/IFFT API调用独立处理多个贴图。由于这个原因,我已经将每个tile放置在它自己的CUDA流中,因此每个tile都相对于主机异步地执行它的操作字符串。每个tile在迭代中大小相同,因此它们共享一个cuFFT计划。主机线程快速移动命令以尝试使GPU加载工作。

    0热度

    1回答

    我正在使用带有ipython 3.6.1及其加速包的anaconda套件。在这两个函数fft和ifft中有一个cufft子包。据我所知,这些都是一个numpy数组,输出到一个numpy数组,在系统内存中,即所有gpu内存和系统与gpu内存之间的传输都会自动处理,并且在函数结束时释放gpu内存。这似乎很好,似乎为我工作。但是,我想在同一个数组上运行多个fft/ifft调用,并且每次从数组中提取一个数

    1热度

    1回答

    我目前正在调试我的代码,我使用CUDA FFT例程。 我有这样的事情(请参阅留言给我的想法对我做什么): #include <cufft.h> #include <cuda.h> #include <cuda_runtime.h> #include <cuComplex.h> void foo(double* real, double* imag, size_t size) {

    0热度

    1回答

    我使用Alea GPU在使用C#语言的GPU上进行编程。我在Visual Studio 2017项目上安装了Alea 3.0.4,但我找不到一些cuFFT库。在NVidia的网站上,cuFFT是CUDA工具包的一部分,因此我不需要下载其他CUDA库。我是否需要下载一些额外的绑定,或者可以在Alea GPU上使用cuFFT?

    10热度

    2回答

    我正在尝试使用cuFFT的回调函数来快速执行输入格式转换(例如,计算8位整数输入数据的FFT,而无需首先将输入缓冲区显式转换为float)。在我的许多应用程序中,我需要计算重叠输入缓冲区上的FFT,as described in this previous SO question。通常,相邻的FFT可能会重叠1/4到1/8的FFT长度。 cuFFT及其类似FFTW的接口明确支持此via the i

    2热度

    2回答

    我目前正在研究一个必须实现2D-FFT(用于交叉关联)的程序。我用CUDA做了一次FFT,它给了我正确的结果,我现在正在试图实现一个2D版本。在线上很少的例子和文档,我发现很难找出错误是什么。 到目前为止,我一直只使用cuFFT手册。 无论如何,我已经创建了两个5x5阵列,并填充1。我已经将它们复制到GPU存储器中,并完成了前向FFT,将它们相乘,然后对结果进行ifft处理。这给了我一个值为650