thrust

    0热度

    1回答

    当我尝试使用可重定位设备代码启用(-rdc = true)来编译CUDA时,我遇到错误。我使用Visual Studio 2013作为CUDA 7.5的编译器。下面是一个显示错误的小例子。为了澄清,当-rdc = false时,下面的代码运行良好,但是当设置为true时,错误显示出来。 错误简单地说:CUDA错误11 [\ CUDA \详细\幼兽\设备\调度/ device_radix_sort_

    2热度

    1回答

    我试图在两个共享库运行重定位装置代码,无论使用CUDA的推力RDC&推力。如果我停止在kernel.cu中使用推力,一切运行良好,这不是一个选项。 编辑:如果rdc被禁用,程序也可以工作。对我来说也不是一种选择。 它编译正常,但在运行时停止并出现段错误。 gdb告诉我这个: Program received signal SIGSEGV, Segmentation fault. 0x000000

    0热度

    1回答

    我目前正在将代码从本地C++传输到CUDA,同时使用thrust::device_vector s。现在有一个函数来计算渐变,我还需要访问不仅当前元素,而且还访问周围的元素。在原来的代码中,我写道: void calc_grad(Complex *grad, const Complex *data, const int size) { for (int i = 1; i < size

    0热度

    1回答

    我为与-time/2步填充向量t时间/ 2和步长DT以下功能: #define THRUST_PREC thrust::complex<double> __host__ void generate_time(thrust::device_vector<THRUST_PREC> *t, const double dt, const double time) { THRUST_PREC

    2热度

    1回答

    我想学习如何使用CUDA与推力,我已经看到了一些代码,其中的printf函数似乎从设备使用。 考虑以下代码: #include <thrust/host_vector.h> #include <thrust/device_vector.h> #include <cstdio> struct functor { __host__ __device__ void oper

    0热度

    1回答

    我收到的主旨的模板实例中的编译时错误尝试执行以下操作时: thrust::copy_if(deviceEntries.begin(), deviceEntries.end(), hostResultBuffer->begin(), IsEntrySelected(rootLayer)); 定义为IsEntrySelected: struct IsEntryS

    2热度

    1回答

    我有一个使用推力CUDA程序执行::减少并行和:例如, thrust::device_ptr<double> tmp(aux); double my_sum = thrust::reduce(tmp, tmp + G); 其中double* aux指向设备上G连续双打。我需要将整个并行化程序的运行时间与没有并行计算的版本进行比较。有没有办法在设备上只使用一个线程来运行thrust::redu

    0热度

    1回答

    我想知道是否有一种模拟方法可以提升计算功能(http://www.boost.org/doc/libs/1_61_0/libs/compute/doc/html/boost_compute/advanced_topics.html#boost_compute.advanced_topics.custom_functions),它可以转化为内核,并且可以创建为嵌入式内嵌代码,从而变成内核?

    1热度

    1回答

    我想覆盖底层的CUDA设备内存分配器(作为thrust :: system :: cuda :: detail :: malloc())来实现)以便在主机(CPU)线程上调用时使用自定义分配器,而不是直接调用cudaMalloc()。 这可能吗?如果是这样,是否可以使用Thrust“执行策略”机制来执行此操作?我试过这样一个模型: struct eptCGA : thrust::system::c

    0热度

    1回答

    我已经使用不使用推力设备向量的普通CUDA代码编写了内核。内核输出存储在设备数组中的一些结果,比如说数组X.我想现在对X进行缩减。是否有一种方法可以在不先将X复制到推力的情况下使用thrust :: reduction函数: device_vector变量?