nvcc

4热度

1回答

限制寄存器使用在CUDA：__launch_bounds__ VS maxrregcount

从NVIDIA CUDA C Programming Guide：注册用法可以使用编译器maxrregcount 选项控制或如启动界描述启动边界。从我的理解（和纠正我，如果我错了），而-maxrregcount限制寄存器整个.cu文件可以使用的数量，__launch_bounds__预选赛定义每个__global__内核maxThreadsPerBlock和minBlocksPerMultip

1热度

1回答

CUDA 8.0 nvcc fatal：指定ouputtfile时非链接阶段所需的单个输入文件

我试图链接CUDA项目中的对象文件。下面是我的makefile： CUDA_PATH := /usr/local/cuda NVCC := $(CUDA_PATH)/bin/nvcc NVCCFLAGS := -arch=sm_37 --device-c -std=c++11 -cudart=shared -rdc=true LIBS := -lcutil -lcudpp -lcuda

1热度

1回答

从结构

启动Cuda的调用中给出一个简单的结构来包装CUDA代码，才能写出像 func<float> s; s.val = 3.f; start_correct<<<1, 2>>>(s); 不过，我想放块，格，共享内存计算入结构，并调用像 func<float> s; s.val = 3.f; s.launch(); 内核虽然第一是工作，第二个给了我一个非法内存访问错误。一个最小的例子来

2热度

1回答

NVCC寄存器使用情况报告

我试图让使用NVCC选项 --ptxas-options=v我CUDA内核有关的寄存器使用情况的信息，并同时与全球功能一切正常，我有一些困难由于 ptxas info : Used N registers 线设备那些缺少在输出中。我试图使用noinline关键字，并将它们保存在另一个文件中，与调用全局函数有关，因为我认为NVCC报告了全局函数的全部注册使用情况，包括内联后的被调用设备的全局函数，但

2热度

1回答

无效配置参数块的16位比

更大此代码工作正常： #include <stdio.h> #define N 1000 // <-- Works for values < 2^16 __global__ void add(int *a, int *b) { int i = blockIdx.x; if (i<N) { b[i] = 2*a[i]; } } int main(

0热度

1回答

如何将conio.h添加到Linux中的nvcc中

我是CUDA 8中的新devopler并使用nvcc编译我的代码如何通过我运行我的代码的方式将conio.h安装到我的编译器中服务器在一家公司谢谢

2热度

1回答

CUDA：忘记内核启动配置不会导致NVCC编译器警告或错误

当我尝试使用函数指针调用CUDA内核（__global__函数）时，一切看起来都很好。但是，如果我在调用内核时忘记提供启动配置，NVCC不会导致错误或警告，但是如果我尝试运行该程序，程序将会编译并崩溃。 __global__ void bar(float x) { printf("foo: %f\n", x); } typedef void(*FuncPtr)(float); void i

-2热度

1回答

NVCC编译特征库，并在运行时在结构中调整MatrixXd的大小失败

我在ubuntu 16.04 LTS中使用了带有g ++ 5.4和CUDA 8.0的Eigen library version 3.3。编写代码时发生了令人困惑的事情。当我尝试在一个结构中调整Eigen :: MatrixXd时发生崩溃结构如下。 struct cudaCopy{ struct s_path_info *nodes_parents struct s_p

0热度

1回答

特征库（3.3.4）的分割错误

我正在使用Eigen进行一些仿真。无论何时我甚至包括最小的过载特征运算（即使我有x=y其中x,y是Eigen::VectorXd具有相同尺寸），我都会得到分段错误错误（更准确地说Segmentation fault (core dumped)，没有其他细节）。这很奇怪的是，只有在某些函数中有矩阵运算时才会发生这种情况。让我告诉你： //main.cu #include <Eigen/Dense

0热度

1回答

为什么typedefed结构无法用NVCC编译？

typedef struct { long long int mem_0; } Tuple1; typedef struct { int tag; union { struct Tuple1 Union0Case0; } data; } Union0; C:/Users/Marko/Documents/Visual Studio 20