cublas

    0热度

    1回答

    使用CMake构建我的项目我收到以下链接器错误,不知道如何解决它。使用make VERBOSE=1揭示看起来OK我生成的命令: [email protected]:~/code/myproject/build_debug$ /usr/bin/c++ -Wall -Wextra -Wshadow -Woverloaded -virtual -g3 -ggdb3 -fopenmp CMake

    1热度

    1回答

    我打与matrixMulCUBLAS示例代码,并试图改变默认的矩阵大小的东西稍微更有趣的行数= 5K x栏= 2.5K,然后例如失败,在行#377错误Failed to synchronize on the stop event (error code unknown error)!当所有的计算完成它显然是清理cublas。这是什么意思?以及如何解决? 我有CUDA与EVGA FTW nVidia

    0热度

    1回答

    例如,cublas<t>geam()会做: 但是,如果我想将结果存储在A反正什么?我可以用指针*C = *A,这样称呼它: 而不必担心我可能会写输出仍然被读取作为输入矩阵? 如果是这样,保证我们可以安全地完成所有其他CUBLAS矩阵操作?

    1热度

    1回答

    我想在我的GPU上设置一个大矩阵来解决带有CULA的方程式系统。 为你一些数字,来理解这个问题: big matrix: 400x400 small matrices: 200x200 现在我想小矩阵的每个季度(100x100)复制到第二个矩阵的特定部分。 我发现了两个可能的但明显很慢的例子:cublasSetMatrix和cublasGetMatrix支持主要维度的规范,所以我可以把这些

    1热度

    3回答

    例如, cublasStatus_t cublasSgemm(cublasHandle_t handle, cublasOperation_t transa, cublasOperation_t transb, int m, int n, int k, const float *alpha, const float

    1热度

    1回答

    CUBLAS对每种类型的数据的separate function,但我想一个模板内调用CUBLAS,例如: template <typename T> foo(...) { ... cublas<S/D/C/Z>geam(..., const T* A, ...); ... } 如何触发了正确的函数调用?

    -1热度

    1回答

    我有以下的matlab代码; tempx = full(sum(X.^2, 2)); tempc = full(sum(C.^2, 2).'); D = -2*(X * C.'); D = bsxfun(@plus, D, tempx); D = bsxfun(@plus, D, tempc); 其中X是nxm,W是kxm矩阵。一个是数据,另一个是权重矩阵。我用给定的代码找到距离矩阵D

    -3热度

    1回答

    我有一个向量V有nx1项目和矩阵M有nxm项目。我想用CUDA将M的所有列与V相加。 THRUST或CUBLAS中是否有任何方法可以帮助我解决问题?

    0热度

    1回答

    所以我有这个代码,它假设以不同的方式计算矩阵的点积(其中之一是在C++中使用bla),但是当我尝试使用nvcc编译代码,它不起作用,它说我有一个未定义的引用ddot。这很奇怪,因为我很确定我在这里引用了cublas的调用符号:http://www.sdsc.edu/us/training/assets/docs/NVIDIA-03-Toolkit.pdf 任何人都可以帮我吗?下面是我遇到的一段代码

    -1热度

    1回答

    所以我有一个执行矩阵乘法的代码,但问题是当我使用库-lcublas和编译器nvcc时,它只返回零值;然而,当我使用编译器时,代码运行良好,只需对函数名进行一些调整,g ++与库-lblas即可。 您可以使用-lcublas库从不在GPU上的内存执行矩阵乘法吗? 下面是返回0的代码: extern "C" //external reference to function so the code co