opencl

    0热度

    3回答

    我想在一个i.mx6平台上使用OpenCL来改进bayer到rgb的转换。我正在使用the OpenCL Shader进行转换。我期待的OpenCL版本将比OpenCV的cvtColor bayer到rgb转换(它使用for循环)更快。但事实证明,OpenCL版本比OpenCV的基于CPU的转换慢得多。 OpenCV的:28.3 FPS为1280 * 960的图像 的OpenCL:7.15 FPS

    1热度

    1回答

    我对“cl_mem”或“cl_context”等各种类型的底层类型有点困惑。通过opencl头文件,看起来好像它们实际上是结构实例指针,这会使它们安全地复制,但据我所知,它们没有任何可以访问的成员。或 - >运营商。 从本质上讲,它们在将它们传入函数参数或将它们推入矢量等时是否安全?

    0热度

    1回答

    本周我遇到了一个非常流行的错误:CL_PLATFORM_NOT_FOUND_KHR使用OpenCL.jl。但谷歌没有发现有助于克服它。我试过完全重新安装CUDA,使用不同版本的驱动程序等。 奇怪的是:deviceQuery CUDA工具按预期工作,而julia有错误。

    1热度

    3回答

    我想安装caffe,我想知道是否可以在AMD/OpenCL上使用cuDNN。 因为我的显卡是AMD https://github.com/BVLC/caffe/tree/opencl

    0热度

    2回答

    我想将私有数据块有效地复制到本地内存。每个工作项目需要复制3个字节的本地存储器,所以目前我做的: __kernel void apply(__local uchar* lmem) { int offset = ...; uchar data[3] = {1,2,3}; // just an example, is passed as an argument in fact

    2热度

    2回答

    我试图设置新的__local浮点数,但当我将float的大小作为参数传递时出现错误。 此代码给出错误: int TILE_DIM = get_local_size(0)*get_local_size(1); //local size __local float buffer[TILE_DIM]; 此代码不: int TILE_DIM = get_local_size(0)*get_local

    1热度

    1回答

    我在OpenCL中实现了一些并行BLAS例程。为了检查内核是否正确,我也以一种天真的方式实现了相同的例程。在执行内核之后,我将内核结果与朴素实现的结果进行比较。 据我所知,我无法将float的值与==进行比较。因此,我计算两个floats的绝对差异并检查它是否超出限制。我已阅读this article,其中描述了其他几种比较floats的方法。然而,我的问题是,我不确定用于比较floats的限制。

    0热度

    1回答

    我很难理解OpenCL特别是OpenCL 2.0+是共享的,分布式的还是分布式的共享内存架构,尤其是与具有许多OpenCL的计算机设备在同一台PC上。 特别是,我可以看到它是一个共享内存系统,它们都可以访问全局内存,但是他们的计算单元具​​有类似网络的特点,这让我怀疑它是否可以经典地归类为分布式共享内存架构

    0热度

    1回答

    我正在试图放大图像254倍。 read_imagef返回的结果不是线性的,而是楼梯 - 我观察每15点跳跃一次。采样器的精度是多少? 输入是9个值,输出是2304个值。从输出 摘录: x read_imagef 120 120 121 120.9375 122 121.875 123 122.8125 124 123.75 125 124.6875 126 125.625 127

    1热度

    1回答

    的OpenCL的-Implemantation使用语法/函数我试着去了解OpenCV的范围内使用OpenCL的,但我不明白: 这是一个例子Codepart从orb.cpp其中名为ORB_HarrisResponses内核位于orb.cl创建(propably): ocl::Kernel hr_ker("ORB_HarrisResponses", ocl::features2d::orb_oclsr