cufft

    0热度

    1回答

    我正在使用cufft实现并找不到任何对cufftcomplex函数的引用。尽管如此,我通过谷歌发现了cucomplex.h,但这并不能帮助我。具体而言,我想知道,如何读出cufftcomplex结构的虚部和实部。

    1热度

    1回答

    我正在使用批次cuFFT进行实验。但我认为我没有得到正确的结果。 int NX = 16; // size of the array int BATCH = 16; // # of batch 我在GPU上分配两个数组: float *src; cufftComplex *dst; cudaMalloc((void**)&src, sizeof(float)*NX*BATCH); cu

    0热度

    1回答

    我想并行化一个声纹指纹库的Chromaprint FFT变换。它的工作原理是“将原始音频分成许多重叠帧并对其应用傅立叶变换。” Chromaprint使用4096帧大小,2/3重叠。例如,第一帧由元素[0 ... 4095]组成,则第二帧类似[1366 ... 5462]。 随着cufftPlanMany,我知道你可以指定批量大小4096,这将批量执行[0 ... 4095],[4096 ...

    0热度

    1回答

    所以cufftComplex类型与n结构与x和y -field,分别表示实部和各复数的虚部的阵列。 在另一方面,如果我想创建在OpenGL顶点缓冲区对象与x-和y-领域,即2D顶点或只是还表示n复数顶点缓冲区对象,我会创建一个2n浮标大小的数组具有这样的布局: x0 y0 | x1 y1 | ... | xn yn 我然后通过调用其写入VBO: glBufferData(GL_ARRAY_BU

    1热度

    1回答

    我以前帮助this答案实现就地转换,它运作良好,但只有当我从真实的数据开始。如果我从复杂的数据开始,IFT + FFT之后的结果是错误的,而且这只发生在原地版本中,我用这个变换的不合适版本得到了完美的结果。 这是代码: #include <stdio.h> #include <stdlib.h> #include <cuda_runtime.h> #include <complex.h>

    -2热度

    1回答

    我有这个程序有问题: #include <stdlib.h> #include <stdio.h> #include <string.h> #include <math.h> #include <cufft.h> #include <cuComplex.h> #define SIGNAL_SIZE 1024 int main(int argc, char **argv) {

    1热度

    1回答

    第一次调用cufftPlanMany()时,大约需要0.7秒,但接下来的所有调用都很快。 任何想法如何加速第一次调用cufftPlanMany()?

    2热度

    1回答

    什么是使用cufftGetSize1d(或任何cufftGetSize*)函数的正确方法? 我试着用: cufftHandle plan; size_t workSize; cufftResult result; cufftCreate(&plan); result = cufftGetSize1d(plan, 1000, CUFFT_C2C, 1, &workSize); 然而,最后

    0热度

    1回答

    我已经实现了CUDA版本的逆离散余弦变换(IDCT),通过“翻译”MATLAB内置函数idct.m到CUDA: 我实现cuIDCT.cu,工作时米= N两者米和ñ是偶数。 cuIDCT.cu #include <stdio.h> #include <stdlib.h> #include <cuda.h> #include <cufft.h> #include <cuComplex.h>

    0热度

    1回答

    我开始移植现有的fftw3应用程序以使用cuda fftw库。最初阶段是简单地用cufft.h标题替换fftw3.h标题并链接标记库而不是fftw3库。 这很简单,代码编译为nvcc。但是,当我执行代码时,应用程序无法使用fftw_plan_guru_dft命令创建计划(它只返回0而不是有效的计划)。 由于没有错误报告,所以我不知道如何调试此问题。 cuda-gdb和gdb不提供任何进一步的见解。