cuda

0热度

1回答

CUDA 8.0 cudaMemcpy()是否同时复制整个内存块，或逐字节复制？我想限制复印时间，但我无法在文档中找到任何指定cudaMemcpy()是线性还是恒定时间操作的内容。

0热度

1回答

我有一个二进制图像，将有一个或多个blob。我想要每个blob的像素列表。如果我可以为每个blob找到一个种子点，我可以通过填充来查找blob的像素。对这个问题做了一些研究，我想我想要的算法是“连接组件标签”。我看到的大多数示例只是对Blob输出进行颜色编码。使用这种算法，我可以收集：blob上的一个点和blob的轴对齐边界框？连接的组件标签听起来像是我需要的正确算法吗？有没有人有一个很好的C

-1热度

1回答

CUDA - 如何交换设备数组指针？

我写了一个函数swap来方便地交换设备数组指针，但它不工作，我假设我交换交换功能中的本地数组指针，而不是我传递给它的那些指针。 __global__ void device_add_one(float *A, float *B) { for (int index = blockIdx.x * blockDim.x + threadIdx.x; index < N;

0热度

1回答

R无法打开：丢失cufft64_80.dll

我试图安装mxnet GPU软件包，但失败了。于是，我开始使用CPU来代替。但是，我遇到了这个问题，打开R和Rstudio时出现错误。我已经搜索发现cufft64_80.dll在CUDA库中，但我无法在Windows中安装NVIDIA CUDA 8.0。我该如何处理？有一些地方我可以下载这个DLL吗？在此先感谢！

0热度

1回答

如何编译CUDA牛顿模板元编程示例程序

如何在 Evaluating expressions consisting of elementwise matrix operations in Thrust 仅供参考编译样本CUDA牛顿元编程程序，牛顿是在这里：https://github.com/jaredhoberock/newton 这里开始我的输出： nvcc -I. -I/local/cuda/include test_newton

0热度

1回答

OpenGL和CUDA之间的不一致最大线程数

我的GPU是NVIDIA GeForce GT440，其计算能力版本是2.x. NVIDIA的官方CUDA_C_Programming_Guide指出限制1.每块= 1024 限制2.每多居民的最大线程数的最大线程数= 1536 但是，有两个OpenGL的计算机着色器实现限制是极限3. GL_MAX_COMPUTE_WORK_GROUP_INVOCATIONS = 1536 我的问题是 1.为

-1热度

1回答

cublasDGemm奇怪的结果

我想用cublasDgemm（）来计算矩阵的乘积的乘积。输入矩阵和输出我从我的代码期待有以下几种（A和C分别）： | 1 4 7 | | 66 78 | A = | 2 5 8 | C = | 78 93 | 不过我得到奇怪的结果，这是一个有点困难我理解维度CUBLAS/CUDA用途（专栏）。任何提示将不胜感激！ #include <stdio.h> #include <stdlib.h

0热度

1回答

cuda中的线程/扭曲本地锁

我想在cuda中实现关键部分。我在这个主题上阅读了很多问题和答案，答案通常涉及到atomicCAS和atomicExch。然而，这并不在经一级的工作，因为在经所有线程获取该atomicCAS后相同的锁，从而导致死锁。我觉得有一种方法有使用经__ballot或__any指令CUDA一个真正的锁。然而，多次尝试后，我没有得到一个满意的（读工作）解决方案。有没有人在这里有一个很好的答案呢？ PS

-1热度

1回答

NVCC不执行内核代码在Ubuntu 17.10

我已经写了下面的代码 #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include<iostream> using namespace std; __global__ void hello() { printf("Hello"); } int ma

1热度

1回答

安装Cuda 8，它似乎缺少npp.lib

我有一些旧的代码，我继承了，我想升级到最新的cuda，所以我安装了Cuda 8，但编译它时抱怨无法找到npp.lib，我检查了C：\ Program Files \ NVIDIA GPU Computing Toolkit \ CUDA \ v8.0 \ lib \ x64并找不到它，我看到一堆npp {xxx} .lib，其中xxx是更多文本，但没有什么只是npp.lib。这在最新的cuda中被