nvcc

    4热度

    1回答

    从NVIDIA CUDA C Programming Guide: 注册用法可以使用编译器maxrregcount 选项控制或如启动界描述启动边界。 从我的理解(和纠正我,如果我错了),而-maxrregcount限制寄存器整个.cu文件可以使用的数量,__launch_bounds__预选赛定义每个__global__内核maxThreadsPerBlock和minBlocksPerMultip

    1热度

    1回答

    我试图链接CUDA项目中的对象文件。下面是我的makefile: CUDA_PATH := /usr/local/cuda NVCC := $(CUDA_PATH)/bin/nvcc NVCCFLAGS := -arch=sm_37 --device-c -std=c++11 -cudart=shared -rdc=true LIBS := -lcutil -lcudpp -lcuda

    1热度

    1回答

    启动Cuda的调用中给出一个简单的结构来包装CUDA代码,才能写出像 func<float> s; s.val = 3.f; start_correct<<<1, 2>>>(s); 不过,我想放块,格,共享内存计算入结构,并调用像 func<float> s; s.val = 3.f; s.launch(); 内核虽然第一是工作,第二个给了我一个非法内存访问错误。 一个最小的例子来

    2热度

    1回答

    我试图让使用NVCC选项 --ptxas-options=v我CUDA内核有关的寄存器使用情况的信息,并同时与全球功能一切正常,我有一些困难由于 ptxas info : Used N registers 线设备那些缺少在输出中。我试图使用noinline关键字,并将它们保存在另一个文件中,与调用全局函数有关,因为我认为NVCC报告了全局函数的全部注册使用情况,包括内联后的被调用设备的全局函数,但

    2热度

    1回答

    更大此代码工作正常: #include <stdio.h> #define N 1000 // <-- Works for values < 2^16 __global__ void add(int *a, int *b) { int i = blockIdx.x; if (i<N) { b[i] = 2*a[i]; } } int main(

    0热度

    1回答

    我是CUDA 8中的新devopler并使用nvcc编译我的代码 如何通过我运行我的代码的方式将conio.h安装到我的编译器 中服务器在一家公司 谢谢

    2热度

    1回答

    当我尝试使用函数指针调用CUDA内核(__global__函数)时,一切看起来都很好。但是,如果我在调用内核时忘记提供启动配置,NVCC不会导致错误或警告,但是如果我尝试运行该程序,程序将会编译并崩溃。 __global__ void bar(float x) { printf("foo: %f\n", x); } typedef void(*FuncPtr)(float); void i

    -2热度

    1回答

    我在ubuntu 16.04 LTS中使用了带有g ++ 5.4和CUDA 8.0的Eigen library version 3.3。 编写代码时发生了令人困惑的事情。 当我尝试在一个结构中调整Eigen :: MatrixXd时发生崩溃 结构如下。 struct cudaCopy{ struct s_path_info *nodes_parents struct s_p

    0热度

    1回答

    我正在使用Eigen进行一些仿真。无论何时我甚至包括最小的过载特征运算(即使我有x=y其中x,y是Eigen::VectorXd具有相同尺寸),我都会得到分段错误错误(更准确地说Segmentation fault (core dumped),没有其他细节)。这很奇怪的是,只有在某些函数中有矩阵运算时才会发生这种情况。 让我告诉你: //main.cu #include <Eigen/Dense

    0热度

    1回答

    typedef struct { long long int mem_0; } Tuple1; typedef struct { int tag; union { struct Tuple1 Union0Case0; } data; } Union0; C:/Users/Marko/Documents/Visual Studio 20