cuda

    0热度

    1回答

    CUDA 8.0 cudaMemcpy()是否同时复制整个内存块,或逐字节复制? 我想限制复印时间,但我无法在文档中找到任何指定cudaMemcpy()是线性还是恒定时间操作的内容。

    0热度

    1回答

    我有一个二进制图像,将有一个或多个blob。我想要每个blob的像素列表。如果我可以为每个blob找到一个种子点,我可以通过填充来查找blob的像素。 对这个问题做了一些研究,我想我想要的算法是“连接组件标签”。我看到的大多数示例只是对Blob输出进行颜色编码。使用这种算法,我可以收集:blob上的一个点和blob的轴对齐边界框? 连接的组件标签听起来像是我需要的正确算法吗?有没有人有一个很好的C

    -1热度

    1回答

    我写了一个函数swap来方便地交换设备数组指针,但它不工作,我假设我交换交换功能中的本地数组指针,而不是我传递给它的那些指针。 __global__ void device_add_one(float *A, float *B) { for (int index = blockIdx.x * blockDim.x + threadIdx.x; index < N;

    0热度

    1回答

    我试图安装mxnet GPU软件包,但失败了。于是,我开始使用CPU来代替。但是,我遇到了这个问题,打开R和Rstudio时出现错误。 我已经搜索发现cufft64_80.dll在CUDA库中,但我无法在Windows中安装NVIDIA CUDA 8.0。 我该如何处理?有一些地方我可以下载这个DLL吗? 在此先感谢!

    0热度

    1回答

    如何在 Evaluating expressions consisting of elementwise matrix operations in Thrust 仅供参考编译样本CUDA牛顿元编程程序,牛顿是在这里:https://github.com/jaredhoberock/newton 这里开始我的输出: nvcc -I. -I/local/cuda/include test_newton

    0热度

    1回答

    我的GPU是NVIDIA GeForce GT440,其计算能力版本是2.x. NVIDIA的官方CUDA_C_Programming_Guide指出 限制1.每块= 1024 限制2.每多居民的最大线程数的最大线程数= 1536 但是,有两个OpenGL的计算机着色器实现限制是 极限3. GL_MAX_COMPUTE_WORK_GROUP_INVOCATIONS = 1536 我的问题是 1.为

    -1热度

    1回答

    我想用cublasDgemm()来计算矩阵的乘积的乘积。输入矩阵和输出我从我的代码期待有以下几种(A和C分别): | 1 4 7 | | 66 78 | A = | 2 5 8 | C = | 78 93 | 不过我得到奇怪的结果,这是一个有点困难我理解维度CUBLAS/CUDA用途(专栏)。任何提示将不胜感激! #include <stdio.h> #include <stdlib.h

    0热度

    1回答

    我想在cuda中实现关键部分。我在这个主题上阅读了很多问题和答案,答案通常涉及到atomicCAS和atomicExch。 然而,这并不在经一级的工作,因为在经所有线程获取该atomicCAS后相同的锁,从而导致死锁。 我觉得有一种方法有使用经__ballot或__any指令CUDA一个真正的锁。 然而,多次尝试后,我没有得到一个满意的(读工作)解决方案。 有没有人在这里有一个很好的答案呢? PS

    -1热度

    1回答

    我已经写了下面的代码 #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include<iostream> using namespace std; __global__ void hello() { printf("Hello"); } int ma

    1热度

    1回答

    我有一些旧的代码,我继承了,我想升级到最新的cuda,所以我安装了Cuda 8,但编译它时抱怨无法找到npp.lib,我检查了C:\ Program Files \ NVIDIA GPU Computing Toolkit \ CUDA \ v8.0 \ lib \ x64并找不到它,我看到一堆npp {xxx} .lib,其中xxx是更多文本,但没有什么只是npp.lib。这在最新的cuda中被