opencl.net

    1热度

    2回答

    我是使用Visual Studio C#使用OpenCL(与OpenCL.NET库)的新手,目前正在研究计算大型3D矩阵的应用程序。在矩阵中的每个像素处,计算192个唯一值,然后相加以产生该像素的最终值。因此,在功能上,它就像一个4-d矩阵,(161 X 161 X 161)×192 现在我打电话从我的主机代码这样的内核: //C# host code ... float[] BigMatri

    2热度

    2回答

    在CUDA发现连续指数涵盖多个块,从而incerase指数的范围阵列,我们做一些事情是这样的: 主机端代码: dim3 dimgrid(9,1)// total 9 blocks will be launched dim3 dimBlock(16,1)// each block is having 16 threads // total no. of threads in /

    0热度

    1回答

    有两个圆形的语句,例如: for(int i=0;i<1000;i++) for (int j=0;j<1000;j++) { for(int k=i*5;k<i*5+5;k++) for(int l=j*5;l<j*5+5;j++) { marrytemp=A[i]+B[j]+marry; } marry[i,j]=marrytemp;

    0热度

    2回答

    有人能告诉我OpenLAB版本的cudaMemcpyToSymbol用于将__constant复制到设备并返回主机? 或通常的clenquewritebuffer(...)会完成这项工作吗? 在论坛中找不到太多帮助。其实几行演示就足够了。 我还希望opencl中的优化与使用常量缓存的CUDA相同吗? 感谢

    0热度

    1回答

    我正在使用Opencl.net,我正在尝试在GPU上执行一些图像处理。不幸的是,只有第一个像素([0; 0])具有正确的值,剩下的是(0; 0; 0; 0)。 OpenCL内核应该为每个像素的所有颜色分量赋值0.5。在我看来,内核只被执行一次(或者读取功能可能只读取第一个像素)。我究竟做错了什么?我从我的代码中省略了不相关的部分: ... int intPtrSize = 0; intPtrS

    3热度

    1回答

    我正在尝试使用.NET对GPU进行图像处理。我已经下载了OpenCL.NET wrapper。它有一些很好的示例,但我找不到一种将图像加载到GPU并将处理后的图像读回的方法。我需要做什么?

    4热度

    2回答

    我正在开发一个程序(在.Net中),它有很多图像处理(如2D卷积,...),我想做他们与GPGPU(并行处理) 所以,我有一些选择:微软加速器,OpenCL.Net,... 哪一个更适合我? 有些事情对我来说重要的是:速度快,兼容性(例如,如果GPU不支持,会发生什么?),简单易学,既Nvidia和ATI的工作,... 而且听说我可以在OpenCL中创建我自己的功能,并为许多阵列单元运行它,但我不

    6热度

    1回答

    鉴于OpenCL旨在成为异构编程的API,几乎定义它具有与其相关的巨大延迟惩罚。因此必须有一个异步API。 但是我发现很难在OpenCL.net中找到异步API。我找到了OpenCl.Net.Event结构,在大多数API调用中这似乎是一个out参数。不过,我无法找到关联该事件的回调,因为opencl.net似乎缺少clSetEventCallback。 有没有人知道如何在opencl.net的a

    0热度

    2回答

    我想传递一个结构的OpenCL内核,该结构是 struct test { int *x; float *y; char *z; }; 和存储器分配和初始化是像 struct test t; t.x = (int*)malloc(sizeof(int)*100); t.y = (float*) malloc (sizeof(float)*50); t.z

    1热度

    2回答

    我是opencl的新手,想做点实验。具体来说,我想知道是否有人能指出我正确的方向来创建一个定制的平台或设备,并附带opencl接口。这是如何被使用的是创建一个简单的模拟器/调试器,与GPU和CPU一起运行。是否有任何有关开发自定义opencl平台,设备等的官方文档?此外,是否有涵盖此领域的优秀在线资源? 谢谢你的帮助。