cufft

0热度

1回答

为什么我会在这个libcufft_static例子中得到“未定义引用__cudaRegisterLinkedBinary_60 _....`”错误？

我在Ubuntu 16.04上使用CUDA 7.5 SDK，通过nvidia-cuda-toolkit包安装。我正在尝试使用cuFFT的回调函数编译一个简单的测试程序;该示例的源代码是available at GitHub。 Following the instructions for compiling with the callback feature，我编译源为可重定位的装置代码和链接对li

2热度

1回答

cufftSetStream导致垃圾输出。难道我做错了什么？

根据该文档时，cufftSetStream()功能相关联的CUDA流与CUFFT计划。在计划执行期间所做的所有内核启动现在都通过关联的流[...直到...]完成，流将通过另一次调用cufftSetStream（）进行更改。不幸的是，结果变成垃圾。下面是一个例子，它通过两种方式执行一系列转换来演示：一种是每个流有自己的专用计划，另一种是单个计划被重用，如上面的文档所示。前者的行为如预期，重用/

2热度

1回答

如何：CUDA IFFT

在Matlab中，当我输入复数的一维数组时，我输出的数组具有相同大小和相同维数的实数。试图在CUDA C中重复此操作，但具有不同的输出。你能帮忙吗？在Matlab中，当我进入IFFT（阵列）我arrayOfComplexNmbers： [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

1热度

1回答

使用cuda从复数转换为实数时输出错误cuFFT

我正在使用cuda版本7.5 cufft来执行一些FFT和反FFT。使用cufftExecC2R(.,.)函数执行逆FFT时，我遇到了问题。其实，当我在cufftPlan1d(,)中使用batch_size = 1时，我得到了正确的结果。但是，当我增加批量大小时，结果不正确。我正在粘贴一个示例代码来说明这一点。我很快就创建了这个代码，请忽略代码的脏乱。 #include <cufft.h>

0热度

1回答

并发流中的CUDA cuFFT API行为

对于某些图像处理，我使用的是CUDA 7.0和nVidia 980 GTX。在特定的迭代中，通过15-20内核调用和多个cuFFT FFT/IFFT API调用独立处理多个贴图。由于这个原因，我已经将每个tile放置在它自己的CUDA流中，因此每个tile都相对于主机异步地执行它的操作字符串。每个tile在迭代中大小相同，因此它们共享一个cuFFT计划。主机线程快速移动命令以尝试使GPU加载工作。

0热度

1回答

用于在fft/ifft调用之间的gpu内存中用于保持阵列的插槽的Anaconda包

我正在使用带有ipython 3.6.1及其加速包的anaconda套件。在这两个函数fft和ifft中有一个cufft子包。据我所知，这些都是一个numpy数组，输出到一个numpy数组，在系统内存中，即所有gpu内存和系统与gpu内存之间的传输都会自动处理，并且在函数结束时释放gpu内存。这似乎很好，似乎为我工作。但是，我想在同一个数组上运行多个fft/ifft调用，并且每次从数组中提取一个数

1热度

1回答

CUDA FFT不返回我期望的值

我目前正在调试我的代码，我使用CUDA FFT例程。我有这样的事情（请参阅留言给我的想法对我做什么）： #include <cufft.h> #include <cuda.h> #include <cuda_runtime.h> #include <cuComplex.h> void foo(double* real, double* imag, size_t size) {

0热度

1回答

在Alea的cuFFT GPU

我使用Alea GPU在使用C＃语言的GPU上进行编程。我在Visual Studio 2017项目上安装了Alea 3.0.4，但我找不到一些cuFFT库。在NVidia的网站上，cuFFT是CUDA工具包的一部分，因此我不需要下载其他CUDA库。我是否需要下载一些额外的绑定，或者可以在Alea GPU上使用cuFFT？

10热度

2回答

为什么cuFFT性能会受到重叠输入的影响？

我正在尝试使用cuFFT的回调函数来快速执行输入格式转换（例如，计算8位整数输入数据的FFT，而无需首先将输入缓冲区显式转换为float）。在我的许多应用程序中，我需要计算重叠输入缓冲区上的FFT，as described in this previous SO question。通常，相邻的FFT可能会重叠1/4到1/8的FFT长度。 cuFFT及其类似FFTW的接口明确支持此via the i

2热度

2回答

CUDA套箍2D示例

我目前正在研究一个必须实现2D-FFT（用于交叉关联）的程序。我用CUDA做了一次FFT，它给了我正确的结果，我现在正在试图实现一个2D版本。在线上很少的例子和文档，我发现很难找出错误是什么。到目前为止，我一直只使用cuFFT手册。无论如何，我已经创建了两个5x5阵列，并填充1。我已经将它们复制到GPU存储器中，并完成了前向FFT，将它们相乘，然后对结果进行ifft处理。这给了我一个值为650