opencl

0热度

3回答

我想在一个i.mx6平台上使用OpenCL来改进bayer到rgb的转换。我正在使用the OpenCL Shader进行转换。我期待的OpenCL版本将比OpenCV的cvtColor bayer到rgb转换（它使用for循环）更快。但事实证明，OpenCL版本比OpenCV的基于CPU的转换慢得多。 OpenCV的：28.3 FPS为1280 * 960的图像的OpenCL：7.15 FPS

1热度

1回答

各种OpenCL锅炉板类型是否可以安全复制？

我对“cl_mem”或“cl_context”等各种类型的底层类型有点困惑。通过opencl头文件，看起来好像它们实际上是结构实例指针，这会使它们安全地复制，但据我所知，它们没有任何可以访问的成员。或 - >运营商。从本质上讲，它们在将它们传入函数参数或将它们推入矢量等时是否安全？

0热度

1回答

OpenCL.jl CL_PLATFORM_NOT_FOUND_KHR

本周我遇到了一个非常流行的错误：CL_PLATFORM_NOT_FOUND_KHR使用OpenCL.jl。但谷歌没有发现有助于克服它。我试过完全重新安装CUDA，使用不同版本的驱动程序等。奇怪的是：deviceQuery CUDA工具按预期工作，而julia有错误。

1热度

3回答

我可以在OpenCL中使用cuDNN吗

我想安装caffe，我想知道是否可以在AMD/OpenCL上使用cuDNN。因为我的显卡是AMD https://github.com/BVLC/caffe/tree/opencl

0热度

2回答

有效地从私有内存复制到本地内存

我想将私有数据块有效地复制到本地内存。每个工作项目需要复制3个字节的本地存储器，所以目前我做的： __kernel void apply(__local uchar* lmem) { int offset = ...; uchar data[3] = {1,2,3}; // just an example, is passed as an argument in fact

2热度

2回答

在OpenCL中设置__local浮点数

我试图设置新的__local浮点数，但当我将float的大小作为参数传递时出现错误。此代码给出错误： int TILE_DIM = get_local_size(0)*get_local_size(1); //local size __local float buffer[TILE_DIM]; 此代码不： int TILE_DIM = get_local_size(0)*get_local

1热度

1回答

检查并行BLAS例程的结果

我在OpenCL中实现了一些并行BLAS例程。为了检查内核是否正确，我也以一种天真的方式实现了相同的例程。在执行内核之后，我将内核结果与朴素实现的结果进行比较。据我所知，我无法将float的值与==进行比较。因此，我计算两个floats的绝对差异并检查它是否超出限制。我已阅读this article，其中描述了其他几种比较floats的方法。然而，我的问题是，我不确定用于比较floats的限制。

0热度

1回答

OpenCL是共享的，分布式的还是混合的内存系统

我很难理解OpenCL特别是OpenCL 2.0+是共享的，分布式的还是分布式的共享内存架构，尤其是与具有许多OpenCL的计算机设备在同一台PC上。特别是，我可以看到它是一个共享内存系统，它们都可以访问全局内存，但是他们的计算单元具有类似网络的特点，这让我怀疑它是否可以经典地归类为分布式共享内存架构

0热度

1回答

OpenCL read_imagef precision

我正在试图放大图像254倍。 read_imagef返回的结果不是线性的，而是楼梯 - 我观察每15点跳跃一次。采样器的精度是多少？输入是9个值，输出是2304个值。从输出摘录： x read_imagef 120 120 121 120.9375 122 121.875 123 122.8125 124 123.75 125 124.6875 126 125.625 127

1热度

1回答

在OpenCV中

的OpenCL的-Implemantation使用语法/函数我试着去了解OpenCV的范围内使用OpenCL的，但我不明白：这是一个例子Codepart从orb.cpp其中名为ORB_HarrisResponses内核位于orb.cl创建（propably）： ocl::Kernel hr_ker("ORB_HarrisResponses", ocl::features2d::orb_oclsr