2013-06-27 39 views
-3

我有一个向量V有nx1项目和矩阵M有nxm项目。我想用CUDA将M的所有列与V相加。 THRUST或CUBLAS中是否有任何方法可以帮助我解决问题?通过CUBLAS或THRUST在CUDA编程bsxfun?

+1

是否有一点你会开始阅读这些库的文档,或者你是否会一直问天真的问题,希望有人会为你做所有的想法?您已经将此问题作为您以前的“将我的Matlab代码移植到CUDA”问题的一部分提出。 – talonmies

+0

可能的重复[我如何找到行到推力或Cublas中两个矩阵W和X之间的所有行距矩阵?](http://stackoverflow.com/questions/17351981/how-can-i-find-row-所有行距离矩阵之间的矩阵-w-和-x-in-t) – talonmies

回答

1

在这里,我有两个向下票

thrust::device_vector<float> dummy_y(N,1); 
alpha = 1.0f; 
beta = 0.0f; 
stat = cublasSger_v2(handle,K,N,&alpha,thrust::raw_pointer_cast(&dummy_y[0]),1,thrust::raw_pointer_cast(&A_sum_vec_d[0]),1,thrust::raw_pointer_cast(&C_d[0]),K); 

我通过行向量,满1秒乘以复制的列向量,如矩阵的大小和cublasSger总结做什么。 stat保持代码的执行状态,您可以检查是否有任何可能的错误。

+0

你不应该在代码中调用任何版本化的API函数。调用'cublasSger'不要'cublasSger_v2'。 – talonmies