nvcc

    0热度

    1回答

    有没有办法将输出格式化为nvcc -Xptxas = -v输出,以便在内核之间有一个换行符?它已经难以从输出读取内核名称出来,例如: ptxas info : 0 bytes gmem ptxas info : Compiling entry function '_Z14dshape_U_noBigPdS_PKdS1_S1_PKi' for 'sm_20' ptxas info : Funct

    3热度

    2回答

    我在文件kernel.cu简单的内核PTX __global__ void add1(double * pi, double c) { *pi += c; } ,并可以很容易地把它编译成一个PTX文件kernel.ptx: NVCC -ptx kernel.cu 现在,我想重现使用cmake具有以下的CMakeLists.txt相同的行为: cmake_minimum_requi

    2热度

    1回答

    是否有一个标志,我可以通过nvcc来处理.cpp文件,就像它会.cu文件?我宁愿不必做cp x.cpp x.cu; nvcc x.cu; rm x.cu。 我问,因为我有我的库中的cpp文件,我想根据传递给Makefile的特定标志来编译/不使用CUDA。

    1热度

    1回答

    我对'-gencode'语句中的'code = sm_X'选项有点困惑。 一个例子:这是什么的NVCC编译器选项 -gencode arch=compute_13,code=sm_13 嵌入在图书馆? 只有具有CC 1.3或GPU的GPU的机器代码(cubin代码)也是具有CC 1.3的GPU的PTX代码? 在'Maxwell兼容性指南'中,声明“只有'code ='子句指定的后端目标版本才会

    0热度

    1回答

    我正在做一些测试,并且我意识到编译时使用-G参数给我的性能比没有它好。 我在Nvidia的检查文档: --device-debug (-G) Generate debug information for device code. 但它并没有帮助我知道为什么给我这么糟糕表现的原因。 它在哪里产生这个调试信息以及何时?这可能是导致这种糟糕表现的原因?

    0热度

    1回答

    我一直在阅读许多与常量内存相关的SO问题,我仍然不明白为什么我的程序无法正常工作。总体而言,它看起来像如下 Common.cuh __constant__ int numElements; __global__ void kernelFunction(); Common.cu #include "Common.cuh" #include <stdio.h> __global__

    0热度

    1回答

    是否有可能在一个项目中针对不同的文件在Nsight Eclipse版本中有不同的编译器?例如,是否可以编辑,编译,链接并运行Nsight中的示例here,而无需明确使用命令行? 我面临的情况是,我需要在CUDA项目中的cpp文件中使用C++ 11标题;但nvcc不支持它。所以,当我在Nsight中开发它时,我不得不使用命令行来编译,链接和运行项目。

    0热度

    2回答

    如何以编程方式查找设备/ nvidia显卡上并发cuda线程或流式多处理器的最大数量?我知道warpSize,但没有warpCount。 most answers on the internet关注自己从pdf中查找东西。

    0热度

    1回答

    我试图实际使用-Wall并删除当前程序中的所有警告。我知道这不是必需的,但它似乎不会受到伤害,也没有证明太耗时。我使用套接字在两个程序之间进行通信:一个在C++ 11(带有c个部分)和另一个在CUDA(因此NVCC与编译器)之间进行通信。插座创作是非常相似的,并且为了防止警告我已经写了线,如: #include<string.h> extern char* strcpy(char*,const

    -2热度

    1回答

    我知道mingw在windows下创建一个可用于创建exe文件的dll文件。我们可以在windows中执行这个exe文件。我正在研究Linux下的cuda项目,但也必须为Windows提供该产品。是否有可能使用Windows下的某种方法生成一个DLL文件?