cuda

0热度

1回答

将设备设置为1时，以及将设备上的'ptr'复制到'host_ptr'之前，必须将设备重新设置为1，才能将ptr置入？ cudaSetDevice(1); cudaMalloc(ptr, size); //do something here ... cudaSetDevice(0); //do something here ... //cudaSetDevice(1); #My

1热度

3回答

如何为阵列结构的阵列分配内存

所以我有一个struct如下所示，我想创建一个该结构的数组并为其分配内存（使用malloc）。 typedef struct { float *Dxx; float *Dxy; float *Dyy; } Hessian; 我的第一反应是为整个结构分配内存，但随后，相信内部阵列（Dxx，Dxy，Dyy）将不会被分配。如果我一个一个地分配内部数组，那么数组的结构将

0热度

1回答

cuDevicePrimaryCtxRetain acc_init

我尝试新的PGI社区版本（17.4）与玩具的例子（见下文）并调用acc_init的时候，我发现了CUDA驱动程序API内部错误后返回CUDA_ERROR_INVALID_DEVICE。重现该错误的代码是： #include <openacc.h> #include <cuda_runtime_api.h> #include <stdio.h> int main() { acc

0热度

1回答

致命错误：cub/cub.cuh：没有这样的文件或目录

我是CUDA和CUB的新手。我发现下面的代码，并试图编译它，但我有这个错误：致命错误：cub/cub.cuh：没有这样的文件或目录。 CUDA的版本是7.0.27 我该如何解决这个错误？谢谢！所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

1热度

1回答

Cuda原子和条件分支

我试图编写CUDA版本的serial代码作为在分子动力学算法中实现周期性边界条件的一部分。这个想法是，有一小部分位置在框外的粒子需要使用两个ways中的一个来重新使用，并限制我使用第一种方式的次数。本质上，它归结为以下MWE。我有一个数组x[N]，其中N很大，并且代码如下serial。 #include <cstdlib> int main() { int N =30000;

2热度

1回答

NVCC寄存器使用情况报告

我试图让使用NVCC选项 --ptxas-options=v我CUDA内核有关的寄存器使用情况的信息，并同时与全球功能一切正常，我有一些困难由于 ptxas info : Used N registers 线设备那些缺少在输出中。我试图使用noinline关键字，并将它们保存在另一个文件中，与调用全局函数有关，因为我认为NVCC报告了全局函数的全部注册使用情况，包括内联后的被调用设备的全局函数，但

0热度

1回答

我得到访问冲突尝试使用CUDA

我刚开始学习如何使用CUDA API和我开始与这个导入引导部分配内存时的写入位置误差：https://devblogs.nvidia.com/parallelforall/even-easier-introduction-cuda/ 我下面的教程，但我想以后与cudaMallocManaged()我想初始化数组分配内存，而是试图初始化数组时，抛出一个异常，它说：异常在VectorAdd.exe在

0热度

1回答

cuda-cudaInvalidValue error当cudaMemcpyToSymbol

我试图将double数组复制到设备上的一块常量内存。但是得到cudaInvalidValue错误。这是我的代码。 #define kCIELEN 95 // length of CIE_X[] const double CIE_X[] = { 1.299000e-04, 2.321000e-04, 4.149000e-04, 7.416000e-04, 1.368000e-03,

0热度

1回答

尝试在Visual Studio中使用Nsight时，“访问路径被拒绝”？

我的程序可以很好地编译和编译。然而，当我尝试运行使用Nsight，我收到以下错误性能分析：这是我从VS2015做： Nsight - >启动性能分析 - >选择CUDA跟踪设置 - >启动我不确定这是否相关，但我试图删除c：\ temp文件夹的只读属性，但它不起作用。现在它说只读（只适用于文件夹中的文件）

0热度

1回答

如何查询全局内存的数量？

我已使用此link中的代码查询设备中可用的全局内存量，但返回值为零。设备上可能没有全局内存（DRAM）？ the output