cuda

    8热度

    3回答

    我的笔记本没有nVidia图形卡,我想在CUDA上工作。该网站称,CUDA也可用于非cuda硬件的仿真模式。但是,当我尝试安装从他们的网站下载的CUDA驱动程序时,它提供了一个错误“nvidia安装程序找不到与您当前的硬件兼容的任何驱动程序,安装程序现在将退出”。 另外,当我试图在Visual Studio 2008中运行SDK中的示例代码时,我收到一个错误,发现.obj文件未找到。

    1热度

    3回答

    我在尝试在CUDA SDK中运行示例代码时出现此错误。我有CUDA 2.3和Visual Studio 2008 LINK:致命错误LNK1181:无法打开输入文件 'cutil32D.lib' 任何指针如何解决此问题?

    3热度

    2回答

    我想知道是否有人可以建议最好的方法来计算大量相对较小的平均值/标准偏差,但是在CUDA中的不同大小的阵列? SDK中平行下降示例工作一个非常大的阵列上,似乎大小为方便每块的线程数的倍数,但我的情况有点不同: 概念,然而,我具有大量的对象,每个对象包含两个组件,分别为upper和lower,并且这些组件中的每一个都具有x和y坐标。即 upper.x, lower.x, upper.y, lower.

    1热度

    2回答

    我想清理由特定线程(因此只能访问该线程)创建的特定内存对象。我实现这一目标的唯一方法是在释放内存块时切换到该特定线程。 我这是怎么分配的特定内存方面: http://imagebin.ca/img/S6mwZBFu.jpg 这就是我试图做: alt text http://imagebin.ca/img/DeTe9Z6h.jpg 我已最初添加的内存环境创建和销毁的方式如下所示: int Threa

    3热度

    2回答

    我是通过在调试一些C/CUDA代码,喜欢的东西踩着: for(uint i = threadIdx.x; i < 8379; i+=256) sum += d_PartialHistograms[blockIdx.x + i * HISTOGRAM64_BIN_COUNT]; 而且我心乱如麻,因为调试器在一个步骤路过它,尽管输出是正确的。我意识到,当我在我的循环中放置大括号时,如下面

    1热度

    2回答

    我需要帮助。我开始用CUDA(2.3/3.0beta)编写一个常见的暴力破解/密码猜测器。 我尝试了不同的方法来生成一个定义的ASCII字符集的所有可能的纯文本“候选者”。 在这个示例代码中,我想要生成所有74^4种可能的组合(并只将结果输出回主机/标准输出)。 $ ./combinations Total number of combinations : 29986576 Maximum

    1热度

    4回答

    我的CUDA代码必须与4个数组一起工作(降低为平均值/ std,计算直方图),每个数组2048浮点时间很长,并且已经从先前的内核存储在设备内存中。 一般建议启动至少与多处理器一样多的块。但是,在这种情况下,我可以将每个数组加载到单个块的共享内存中,因此只能启动4个块。 这远不是'保持gpu繁忙',但如果我使用更多的块,我将需要通过全局内存进行更多的块间通信,并且我预计多处理器的任何额外利用都将由于

    1热度

    5回答

    我正在尝试将CUDA和openCV集成到一个项目中。问题是openCV在使用NVCC时不会编译,而正常的C++项目编译得很好。这对我来说看起来很奇怪,因为我认为NVCC将所有主机代码传递给c/C++编译器,在这种情况下是visual studio编译器。 我得到的错误是? C:\ opencv2.0 \包括\的OpenCV \ cxoperations.hpp(1137):错误:没有操作员 “=”

    13热度

    4回答

    我想用NVIDIA的CUDA在GPU上运行MATLAB代码。我发现一对夫妇第三方引擎: Jacket GPUMat 有人会推荐这些或有更好的在那里?任何提示或建议?

    4热度

    2回答

    CUDA中是否有相当于边界检查器或纯化或valgrind的工具? 我基本上寻找的东西可能告诉我,如果我正在读取或写入分配的内存之外。