我正在尝试编写一个在内核中执行多个向量点积的代码。我正在使用cublasSdot功能从cublas库执行矢量点产品。这是我的代码: using namespace std;
__global__ void ker(float * a, float * c,long long result_size,int n, int m)
{
float *sum;
int id = blockIdx.
产生错误内核代码: __kernel void testDynamic(__global int *data)
{
int id=get_global_id(0);
atomic_add(&data[1],2);
}
__kernel void test(__global int * data)
{
int id=get_global_id(0);
在here罗伯特克罗维拉说,cublas例程可以从设备代码调用。虽然我使用动态并行和使用计算能力3.5进行编译,但我无法通过设备函数调用Cublas例程。我总是得到错误我的代码包含了设备的功能,其调用CUBLAS程序一样cublsAlloc,cublasGetVector,cublasSetVector和cublasDgemm 我的编辑和“从设备/全球功能是不允许调用主机功能”联的命令:
n