cuda

    1热度

    1回答

    我已经在Ubuntu 17.04上安装了cuda-samples-8-0软件包,我想用gcc-5构建样本,我在我的机器上安装了gcc-6。 gcc-6`不被CUDA 8支持,并给出了许多编译错误。如何获得make使用gcc-5? 我试过/usr/local/cuda-8.0/samples目录下的sudo make CXX=g++-5 CC=gcc-5,这个目录仍然导致使用gcc-6。 #erro

    -2热度

    1回答

    class bead { int ID; __host__ __device__ bead(int id){ID=id}; } void main(void){ vector<bead*> beadvec; for(int i=0;i<128;i++){ bead* b1=new bead(i); beadvec.pushback(b1); } } 我不确定如何将指针矢量(

    2热度

    1回答

    我有以下问题,我一直在努力一段时间。 我有一个下面的数组,其由,比方说,16元件实际上是在从许多小阵列组装: [1,1,1,1 | 2,2,2,2 ,2,2 | 3,3,3,3,3,3 | 4,4,4,4] 实际上,一个数组很长,大约512或1024,总的数组长度是小于最大块大小,小于1024.数组驻留在共享内存中,因为它是以前计算的结果。每个子阵列,除了第一个和最后一个是相同的大小,所有的子阵列

    0热度

    1回答

    我最近在加快并行代码,需要一些帮助决定如何MATLAB代码转换成CUDA代码,希望购买了P100 GPU(我搬到从普通gpuarrays在MATLAB远) 。我已经用.ptx内核和MEX -files进行了实验,并且遇到了一些障碍。 并行码具有元素指数,元素乘法,FFT和IFFT调用。它还包含复数。 .ptx是从CUDA内核还是MEX CUDA文件编译的文件更易于使用,哪些将允许我执行必要的FFT

    -1热度

    2回答

    我有一个Windows系统与2个Nvidia GPUs。有人能告诉我哪个GPU是CUDA编译器使用的吗?是否可以切换GPU或将两者一起使用以实现相同的过程?

    1热度

    1回答

    我是新来的推力,但希望得到一个如何在并行排序情况。我有一个超大的gpu列表(1mil +),我试图将它们分类到各个cpu容器中,其中每个容器都有一个device_vector。这个想法是,我想将gpu列表分类到CPU容器拥有的各种device_vector中。 class GpuObject { int someData; int otherValue; }; clas

    2热度

    1回答

    我是OpenCL的初学者,试图将简单的CUDA函数转换为OpenCL。在CUDA功能,他们已经用下面的代码片段获取其操作的指数, int id = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x; 是get_global_id(0)OpenCL中的上述的相同呢? int id = get_global_id(0);

    3热度

    1回答

    我正在使用4个GPU并加速内存传输我尝试使用固定内存使用cudaHostAlloc()。 主UI线程(mfc base)创建4个线程,每个线程调用cudaSetDevice(nDeviceID)。 这是我的问题。我可以在主线程调用cudaHostAlloc(),并将指针指定为lParam,或者在调用cudaSetDevice(nDeviceID)之后,我必须在每个分支线程中调用它? 这里是伪代码。

    0热度

    2回答

    我试图在驻留在GPU内存中的“设备”数据结构中使用可分配数组。代码(粘贴在下面)编译,但给出了段错误。我做了什么明显错误? 模块文件被称为 'gpu_modules.F90',下面给出: !============= ! This module contains definitions for data structures and the data ! stored on the devic

    2热度

    1回答

    我有一个cuda内核函数来交换结构数组中的元素,但是当struct元素足够大时,例如占用了超过120个字节,交换是错的。下面是一个简单的例子: #include <iostream> #include <cuda_runtime.h> using namespace std; const int f_num = 30; const int d_num = 15; struct S