opencl

    3热度

    2回答

    我构建了我自己的小Opencl示例,使用不同的网络资源。实际的内核工作,我得到我想要的输出,但我在其中一个例子中发现的清理函数会导致段错误。我做错了什么? #include <stdio.h> #include <stdlib.h> #include <errno.h> #include <CL/cl.h> //opencl #define CL_CHECK(_expr)

    5热度

    1回答

    我想在我的OpenCL内核中使用#include语句,但它出现Apple的OpenCL编译器缓存内核,所以如果您更改包含文件的内容但不更改包含文件的内容,程序将不会在运行之间更改。 我已经编写了其说明了这一个例子: http://github.com/enjalot/adventures_in_opencl/tree/master/experiments/inc/ 如果你编译并运行,它应该工作的罚

    3热度

    1回答

    在我的最后一个问题OpenCl cleanup causes segfault.中,有人暗示缺少事件处理,即不等待代码完成,可能会导致seg故障。从那以后,我再次查看了我使用的教程,但他们没有注意事件(Matrix Multiplication 1 (OpenCL)和NVIDIA_OpenCL_GettingStartedLinux.pdf)或者详细讨论它(对我来说)可以理解。 你知道OpenCL

    5热度

    2回答

    我正在计算使用OpenCL的n维点之间的欧几里德距离。我得到了两个n维点的列表,我应该返回一个数组,其中只包含第一个表中每个点到第二个表中每个点的距离。 我的做法是做正规多布尔循环(在表1的每一个点{于表2 {每一点...}},然后做使用并联每对点的计算。 的欧几里得然后将距离分为3部分: 1.取点 中的每个尺寸之差2.平方差(仍针对每个尺寸) 3.将所有在2中获得的值相加。 4.取平方根的值(在

    0热度

    1回答

    的OpenCL没有一个全球性的屏障,将停止所有线程,所以我试图围绕创建工作与下面的代码: void barrier(__global uint* scratch) { uint nThreads = get_global_size(0); atom_inc(scratch); /* this loop never terminates */ while(sc

    13热度

    5回答

    我在教程中看到了这两个版本,但我找不到它们的优点和缺点。哪一个是正确的? cl_mem input = clCreateBuffer(context,CL_MEM_READ_ONLY,sizeof(float) * DATA_SIZE, NULL, NULL); clEnqueueWriteBuffer(command_queue, input, CL_TRUE, 0, sizeof(float

    16热度

    3回答

    有一件事我没有想出来,谷歌没有帮助我,为什么有可能银行与共享内存冲突,但不是在全球内存?银行可以与寄存器冲突吗? UPDATE 哇我真的很感谢Tibbit和灰熊的两个答案。看来,我只能给一个绿色的复选标记一个答案,但。我对堆栈溢出很陌生。我想我必须选择一个最好的答案。我可以做些什么来表达谢意,我不给绿色检查的答案吗?

    1热度

    1回答

    我正在使用Compute Prof 3.2和Geforce GTX 280.我有计算能力1.3,我相信。 This file,似乎表明我应该能够看到这些字段,因为我使用的是1.x计算设备。那么我没有看到它们,用户指南3.2工具包说我看不到它们,但称它们为gst_uncoalesced和gst_coalesced。总结起来,如果我正在从全局内存中进行非合并读取,我对如何从分析器中找出问题感到困惑。看

    1热度

    1回答

    我一直有一个艰难的时间建立一个实验,我和CUDA设备上分配内存,采取指针存储在设备上,在OpenCL中使用它,返回结果。我想看看这是否可能。我很难让CUDA项目工作,所以我只在他们的SDK中使用了Nvidia的模板项目。在生成文件中,我将-lOpenCL添加到common.mk的libs部分。当我这样做的时候一切都很好,但是当我将#include <CL/cl.h>添加到template.cu中时

    2热度

    2回答

    我知道OpenCL支持内联函数,但这些函数可以接受并返回OpenCL类型吗? 具体地说,我感兴趣的东西与此签名: 个float4 FUNC(float4变量X,float4变量Y)