我在C中有一个大项目,我正在尝试集成一些Cuda内核。我正在使用“gcc -c main.c”编译我的c文件,使用“nvcc -c cuda_GMRES.cu”编译我的.cu文件,然后尝试使用nvcc链接两个目标文件:“nvcc -o main。 o cuda_GMRES.o“,并收到以下错误:Cuda混合C项目链接
/usr/lib/gcc/x86_64-redhat-linux/4.1.2/../../../../lib64/crt1.o:在功能 _start': (.text+0x20): undefined reference to
主 collect2:LD返回1个退出状态
这是我第一次尝试使用CUDA C文件结合起来,我可能会做一些wrong.Can有人帮我请。我在使用Rocks OS的GPU群集上。
我的main.c文件:
#include <stdio.h>
#include <math.h>
#include "cuda_wrapper.h" //header containing wrapper function
//cuda_GMRES that calls the kernel cuda_dot
int main (int argc,char* argv[])
{
//content
//bla bla bla
//cuda Function call
cuda_GMRES(50);
return 0;
}
我cuda_wrapper.h文件:
#ifndef Cuda_GMRES_cuda_wrapper_h
#define Cuda_GMRES_cuda_wrapper_h
//wrapper function declaration
void cuda_GMRES(double a);
#endif
包含内核调用函数我cuda_GMRES.cu文件:
#include <stdio.h>
#include "cuda_wrapper.h"
#include "cuda_dot.cu"
//kernel declaration
__global__ void cuda_dot();
//kernel calling function
extern "C"
void cuda_GMRES(double a)
{
double b;
double *dev_a;
double *res;
cudaMemcpy(dev_a, &a, sizeof(double), cudaMemcpyHostToDevice);
cuda_dot<<< 1, 1 >>>(*dev_a, res);
cudaMemcpy(&b, res, sizeof(double), cudaMemcpyDeviceToHost);
}
我包含内核的cuda_dot.cu文件:
__global__ void cuda_dot(double a, double *help)
{
*help=2*a;
}
默认链接的程序你确定'nvcc -o main.o cuda_GMRES.o'确实是你正在使用的链接命令? – talonmies 2012-02-18 12:33:27
是的..你认为它应该没有错误? – 2012-02-18 12:36:06
没问题 – talonmies 2012-02-18 12:38:20