cublas

0热度

1回答

使用CMake构建我的项目我收到以下链接器错误，不知道如何解决它。使用make VERBOSE=1揭示看起来OK我生成的命令： [email protected]:~/code/myproject/build_debug$ /usr/bin/c++ -Wall -Wextra -Wshadow -Woverloaded -virtual -g3 -ggdb3 -fopenmp CMake

1热度

1回答

cublas未能同步停止事件？

我打与matrixMulCUBLAS示例代码，并试图改变默认的矩阵大小的东西稍微更有趣的行数= 5K x栏= 2.5K，然后例如失败，在行＃377错误Failed to synchronize on the stop event (error code unknown error)!当所有的计算完成它显然是清理cublas。这是什么意思？以及如何解决？我有CUDA与EVGA FTW nVidia

0热度

1回答

输入矩阵也可以用来存储输出矩阵与CUBLAS？

例如，cublas<t>geam()会做：但是，如果我想将结果存储在A反正什么？我可以用指针*C = *A，这样称呼它：而不必担心我可能会写输出仍然被读取作为输入矩阵？如果是这样，保证我们可以安全地完成所有其他CUBLAS矩阵操作？

1热度

1回答

如何在CUDA中更大的矩阵中复制矩阵

我想在我的GPU上设置一个大矩阵来解决带有CULA的方程式系统。为你一些数字，来理解这个问题： big matrix: 400x400 small matrices: 200x200 现在我想小矩阵的每个季度(100x100)复制到第二个矩阵的特定部分。我发现了两个可能的但明显很慢的例子：cublasSetMatrix和cublasGetMatrix支持主要维度的规范，所以我可以把这些

1热度

3回答

为什么CUBLAS使用const指针作为参数？

例如， cublasStatus_t cublasSgemm(cublasHandle_t handle, cublasOperation_t transa, cublasOperation_t transb, int m, int n, int k, const float *alpha, const float

1热度

1回答

如何在模板函数中使用CUBLAS库？

CUBLAS对每种类型的数据的separate function，但我想一个模板内调用CUBLAS，例如： template <typename T> foo(...) { ... cublas<S/D/C/Z>geam(..., const T* A, ...); ... } 如何触发了正确的函数调用？

-1热度

1回答

如何在Thrust或Cublas的两个矩阵W和X之间找到所有行距矩阵的行？

我有以下的matlab代码; tempx = full(sum(X.^2, 2)); tempc = full(sum(C.^2, 2).'); D = -2*(X * C.'); D = bsxfun(@plus, D, tempx); D = bsxfun(@plus, D, tempc); 其中X是nxm，W是kxm矩阵。一个是数据，另一个是权重矩阵。我用给定的代码找到距离矩阵D

-3热度

1回答

通过CUBLAS或THRUST在CUDA编程bsxfun？

我有一个向量V有nx1项目和矩阵M有nxm项目。我想用CUDA将M的所有列与V相加。 THRUST或CUBLAS中是否有任何方法可以帮助我解决问题？

0热度

1回答

C++和cublas代码的混合不编译

所以我有这个代码，它假设以不同的方式计算矩阵的点积（其中之一是在C++中使用bla），但是当我尝试使用nvcc编译代码，它不起作用，它说我有一个未定义的引用ddot。这很奇怪，因为我很确定我在这里引用了cublas的调用符号：http://www.sdsc.edu/us/training/assets/docs/NVIDIA-03-Toolkit.pdf 任何人都可以帮我吗？下面是我遇到的一段代码

-1热度

1回答

您可以使用cublasDdot（）在非GPU内存中使用blas操作吗？

所以我有一个执行矩阵乘法的代码，但问题是当我使用库-lcublas和编译器nvcc时，它只返回零值;然而，当我使用编译器时，代码运行良好，只需对函数名进行一些调整，g ++与库-lblas即可。您可以使用-lcublas库从不在GPU上的内存执行矩阵乘法吗？下面是返回0的代码： extern "C" //external reference to function so the code co