opencl

    0热度

    1回答

    我目前使用AMD夏威夷GPU并对其有一些疑问。 在AMD夏威夷的说明书中,它具有 2816 Processing Element 44 Computing Units 予理解的是,那么它有2816个线程和44个工作组(每组64个线程) 它是正确的吗? 我对核心,线程,计算单元,工作组和处理元素的概念感到困惑。

    0热度

    1回答

    我将一行矩阵与该行的对角线元素的逆矩阵相乘。我用一维并行代码实现了它。所有线程运行这段代码 1.read the principle diagonal element 2.calculate the inverse of that element 3.multiply inverse with the element indexed at the thread id 问题出现时,第i在第i

    0热度

    1回答

    我想通过与3D音量位置和组ID识别来计算每个组的本地总和。 我的想法是将空间分成组并使用atomic_add来计算local_sum。但是因为我对并行计算并不熟悉,所以很难找到代码和指令之间的相关性。 我现在的内核是这样的: __kernel void TestAtomicAddLocal(__global *int src, int3 size, __global int *res) {

    0热度

    1回答

    我正在使用AMD Radeon Pro duo作为我在opencl中的应用程序。 它具有双斐济GPU,我如何配置Cross Fire使它们作为一个设备工作。我在opencl中使用clgetdeviceinfo来检查设备计算单元,但它显示每个斐济GPU 64。 我在两个GPUS中共有128个计算单元,如何使用Crossfire来使用它们。

    0热度

    1回答

    我最近开始尝试OpenCv,尤其是与功能检测器(例如。SIFT,SURF ...) 现在我开始研究OpenCL,并且我想问是否有OpenCL “支持”这些功能检测器。 虽然“googleing”我发现这个链接1有可能的OpenCL加速功能的问题。但是没有列出特征检测器,只有匹配器。 在github上,我发现了以下代码2,这表明可以使用SURF。 有人知道在OpenCL中实现了哪些Fetectors

    0热度

    1回答

    我目前使用AMD GPU。 /*device memory*/ pattern_obj = clCreateBuffer(context, CL_MEM_READ_ONLY, MAX_PATTERN_SIZE * MAX_PATTERN_NUM * sizeof(cl_char), NULL, &ret); text_objA = clCreateBuffer(context, CL_MEM_

    2热度

    2回答

    除了遗留的OpenCL C内核语言之外,OpenCL 2.1和2.2还引入了OpenCL C++内核语言。我必须在支持C的环境中使用OpenCL,但不支持C++。除OpenCL C++中提供的C++语法之外,是否还有OpenCL 2.2功能,但在OpenCL C中不可用? 我必须使用C++编译器(编写C++主程序)才能使用OpenCL C++内核语言吗?我的理解是,一些OpenCL实现包括一个有限

    0热度

    1回答

    我想在本地地址空间中将数组传递给OpenCL内核。但我得到CL_invalid_VALUE。 int a[]={1,2,3,4,5}; 我们不需要在本地地址空间中创建缓冲区来传递数据。所以: clSetKernelArg(kernel, 21, sizeof(int)*5,a); 内核 __kernel void abc(__local int *a) {} 如果我改变__local

    0热度

    1回答

    我刚刚开始使用pyopencl模块查看python中的OpenCl。 我有兴趣生成没有任何输入的东西,例如生成正弦波的样本。 要做到这一点,我需要的只是全局ID来进行计算,但是返回全局ID会导致一些奇特的数字。我用下面的代码: import numpy as np import pyopencl as cl Size = Width*Height # Get platforms, bot

    0热度

    1回答

    我收到“有时”访问冲突错误;该程序有时会起作用并吐出设备名称和类型,有时只是抛出访问冲突异常。 从我的节目的输出(来自printf的)如下: 不必要的东西检测OpenCL设备的 数:2 所以,很显然我正在检测两个每个平台的设备(请参阅代码中的for循环)。 该数字由getDeviceInfo函数给出并存储在一个虚拟变量中,因此可能在该函数中存在问题。 我调试 getDeviceInfo过程中发现返