cufft

0热度

1回答

我正在使用cufft实现并找不到任何对cufftcomplex函数的引用。尽管如此，我通过谷歌发现了cucomplex.h，但这并不能帮助我。具体而言，我想知道，如何读出cufftcomplex结构的虚部和实部。

1热度

1回答

我正在使用批次cuFFT进行实验。但我认为我没有得到正确的结果。 int NX = 16; // size of the array int BATCH = 16; // # of batch 我在GPU上分配两个数组： float *src; cufftComplex *dst; cudaMalloc((void**)&src, sizeof(float)*NX*BATCH); cu

0热度

1回答

是否有可能将批量FFT与CUDA的cuFFT库和cufftPlanMany重叠？

我想并行化一个声纹指纹库的Chromaprint FFT变换。它的工作原理是“将原始音频分成许多重叠帧并对其应用傅立叶变换。” Chromaprint使用4096帧大小，2/3重叠。例如，第一帧由元素[0 ... 4095]组成，则第二帧类似[1366 ... 5462]。随着cufftPlanMany，我知道你可以指定批量大小4096，这将批量执行[0 ... 4095]，[4096 ...

0热度

1回答

应用CUFFT到OpenGL的顶点缓冲对象

所以cufftComplex类型与n结构与x和y -field，分别表示实部和各复数的虚部的阵列。在另一方面，如果我想创建在OpenGL顶点缓冲区对象与x-和y-领域，即2D顶点或只是还表示n复数顶点缓冲区对象，我会创建一个2n浮标大小的数组具有这样的布局： x0 y0 | x1 y1 | ... | xn yn 我然后通过调用其写入VBO： glBufferData(GL_ARRAY_BU

1热度

1回答

cuFFT错误的结果只有当从复杂的开始

我以前帮助this答案实现就地转换，它运作良好，但只有当我从真实的数据开始。如果我从复杂的数据开始，IFT + FFT之后的结果是错误的，而且这只发生在原地版本中，我用这个变换的不合适版本得到了完美的结果。这是代码： #include <stdio.h> #include <stdlib.h> #include <cuda_runtime.h> #include <complex.h>

-2热度

1回答

CUFFT输出不正确

我有这个程序有问题： #include <stdlib.h> #include <stdio.h> #include <string.h> #include <math.h> #include <cufft.h> #include <cuComplex.h> #define SIGNAL_SIZE 1024 int main(int argc, char **argv) {

1热度

1回答

为什么cufftPlanMany（）需要太长时间？

第一次调用cufftPlanMany（）时，大约需要0.7秒，但接下来的所有调用都很快。任何想法如何加速第一次调用cufftPlanMany（）？

2热度

1回答

CUFFT_INVALID_VALUE in cufftGetSize1d

什么是使用cufftGetSize1d（或任何cufftGetSize*）函数的正确方法？我试着用： cufftHandle plan; size_t workSize; cufftResult result; cufftCreate(&plan); result = cufftGetSize1d(plan, 1000, CUFFT_C2C, 1, &workSize); 然而，最后

0热度

1回答

自我实现的cuIDFT.cu的递归使用导致每次重新运行代码时改变输出

我已经实现了CUDA版本的逆离散余弦变换（IDCT），通过“翻译”MATLAB内置函数idct.m到CUDA：我实现cuIDCT.cu，工作时米= N两者米和ñ是偶数。 cuIDCT.cu #include <stdio.h> #include <stdlib.h> #include <cuda.h> #include <cufft.h> #include <cuComplex.h>

0热度

1回答

调试CUFFTW接口计划创建

我开始移植现有的fftw3应用程序以使用cuda fftw库。最初阶段是简单地用cufft.h标题替换fftw3.h标题并链接标记库而不是fftw3库。这很简单，代码编译为nvcc。但是，当我执行代码时，应用程序无法使用fftw_plan_guru_dft命令创建计划（它只返回0而不是有效的计划）。由于没有错误报告，所以我不知道如何调试此问题。 cuda-gdb和gdb不提供任何进一步的见解。