opencl

    22热度

    3回答

    我正在研究如何使用GPU来处理流数据。我有两个选择,但不能决定走哪条路? 我的指标分析如下: 易于使用的(好API) 社区和文档 性能 未来 我会在C代码和Linux下的C++。

    4热度

    2回答

    我能够遵循指令和编译CUDA 3.0,但无法编译Mac OS X 10.6.3上的OpenCL?

    1热度

    2回答

    支持Nvidia GTX 295的OpenCL支持Linux或预计在不久的将来?

    4热度

    1回答

    我想知道在OpenCL中设置为内核函数的参数数量是否有限制。在设置参数时出现INVALID_ARG_INDEX错误。我在内核函数中设置了9个参数。在这方面请帮助我。

    39热度

    3回答

    我最近一直在玩OpenCL,并且能够编写只使用全局内存的简单内核。现在我想开始使用本地内存,但我似乎无法弄清楚如何使用get_local_size()和get_local_id()一次计算一个“块”输出。 例如,假设我想将Apple的OpenCL Hello World示例内核转换为使用本地内存的东西。你会怎么做?这里的原始内核源代码: __kernel square( __global

    2热度

    1回答

    我试图用OpenCL来并行处理经典的map-reduce问题(它可以与MPI很好地并行),即AMD实现。但结果困扰我。 让我简短的有关该问题的第一位。有两种类型的数据流入系统:特征集(每个30个参数)和样本集(每个9000个维度)。从某种意义上说,这是一个经典的地图缩减问题,我需要计算每个样本(地图)上每个要素的得分。然后,总结每个功能的总体评分(Reduce)。有大约10k功能和30k样本。 我

    0热度

    1回答

    Linux用于编译OpenCL SDK的C/C++示例的基本设置是什么?

    11热度

    5回答

    当我编写我的多核编程课程时,我想到了一些很奇怪的东西,我想和你讨论一下。 我们被要求创建任何程序,显示为多核心平台编程显着改善。我决定尝试在GPU上编写代码来尝试OpenCL。我已经选择了矩阵卷积问题,因为我对它很熟悉(我之前用open_mpi对它进行了并行化处理,对于大图像进行了很大的加速)。 所以在这里,我选择一个大的GIF文件(2.5 MB)[2816X2112],我运行顺序版本(原始代码)

    5热度

    1回答

    我的一位在大学学习游戏开发的朋友目前正在使用OpenCL学习编程。什么是一个简单的项目,教导OpenCL最重要的方面,并可以在大约50 - 100小时内完成?

    11热度

    2回答

    我有一个问题独家计算模式与NVidia + OpenCL。 我可以在nvidia-gpu上用nvidia-smi设置独占计算模式(来自cuda编程指南3.0的第74页)。这意味着,只有一个程序可以在GPU上计算。 cuda运行时间自动调度比应用程序。 但我对于这种情况下的OpenCL的程序有问题:与在GPU 如果一个应用程序运行时有设置好的独特的计算方式和第二的OpenCL程序调用clGetDev