cuda

    0热度

    1回答

    将设备设置为1时,以及将设备上的'ptr'复制到'host_ptr'之前,必须将设备重新设置为1,才能将ptr置入? cudaSetDevice(1); cudaMalloc(ptr, size); //do something here ... cudaSetDevice(0); //do something here ... //cudaSetDevice(1); #My

    1热度

    3回答

    所以我有一个struct如下所示,我想创建一个该结构的数组并为其分配内存(使用malloc)。 typedef struct { float *Dxx; float *Dxy; float *Dyy; } Hessian; 我的第一反应是为整个结构分配内存,但随后,相信内部阵列(Dxx,Dxy,Dyy)将不会被分配。如果我一个一个地分配内部数组,那么数组的结构将

    0热度

    1回答

    我尝试新的PGI社区版本(17.4)与玩具的例子(见下文)并调用acc_init的时候,我发现了CUDA驱动程序API内部错误后返回CUDA_ERROR_INVALID_DEVICE。 重现该错误的代码是: #include <openacc.h> #include <cuda_runtime_api.h> #include <stdio.h> int main() { acc

    0热度

    1回答

    我是CUDA和CUB的新手。我发现下面的代码,并试图编译它,但我有这个错误: 致命错误:cub/cub.cuh:没有这样的文件或目录。 CUDA的版本是7.0.27 我该如何解决这个错误? 谢谢!所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

    1热度

    1回答

    我试图编写CUDA版本的serial代码作为在分子动力学算法中实现周期性边界条件的一部分。这个想法是,有一小部分位置在框外的粒子需要使用两个ways中的一个来重新使用,并限制我使用第一种方式的次数。 本质上,它归结为以下MWE。我有一个数组x[N],其中N很大,并且代码如下serial。 #include <cstdlib> int main() { int N =30000;

    2热度

    1回答

    我试图让使用NVCC选项 --ptxas-options=v我CUDA内核有关的寄存器使用情况的信息,并同时与全球功能一切正常,我有一些困难由于 ptxas info : Used N registers 线设备那些缺少在输出中。我试图使用noinline关键字,并将它们保存在另一个文件中,与调用全局函数有关,因为我认为NVCC报告了全局函数的全部注册使用情况,包括内联后的被调用设备的全局函数,但

    0热度

    1回答

    我刚开始学习如何使用CUDA API和我开始与这个导入引导部分配内存时的写入位置误差:https://devblogs.nvidia.com/parallelforall/even-easier-introduction-cuda/ 我下面的教程,但我想以后与cudaMallocManaged()我想初始化数组分配内存,而是试图初始化数组时,抛出一个异常,它说: 异常在VectorAdd.exe在

    0热度

    1回答

    我试图将double数组复制到设备上的一块常量内存。但是得到cudaInvalidValue错误。 这是我的代码。 #define kCIELEN 95 // length of CIE_X[] const double CIE_X[] = { 1.299000e-04, 2.321000e-04, 4.149000e-04, 7.416000e-04, 1.368000e-03,

    0热度

    1回答

    我的程序可以很好地编译和编译。然而,当我尝试运行使用Nsight,我收到以下错误性能分析: 这是我从VS2015做: Nsight - >启动性能分析 - >选择CUDA跟踪设置 - >启动 我不确定这是否相关,但我试图删除c:\ temp文件夹的只读属性,但它不起作用。现在它说只读(只适用于文件夹中的文件)

    0热度

    1回答

    我已使用此link中的代码查询设备中可用的全局内存量,但返回值为零。 设备上可能没有全局内存(DRAM)? the output