pyopencl

    0热度

    1回答

    我有一个内核源代码,可以在我的PC上的G970上运行,但不会在我的2015年初MacBook Pro上使用Iris 6100 1536MB图形进行编译。 platform = cl.get_platforms()[0] device = platform.get_devices()[1] # Get the GPU ID ctx = cl.Context([device]) # Tell

    0热度

    2回答

    以下是参考我的工作代码: vector = numpy.array([1, 2, 4, 8], numpy.float32) #cl.array.vec.float4 matrix = numpy.zeros((1, 4), cl.array.vec.float4) matrix[0, 0] = (1, 2, 4, 8) matrix[0, 1] = (16, 32, 64, 128) m

    1热度

    1回答

    我有使用PyOpenCL添加多维数组的代码。我的问题是,除了第一个维度外,结果都是错误的。我一直在咨询这Link。 from __future__ import absolute_import, print_function import numpy as np import pyopencl as cl N = 4 a_np = np.random.rand(N,N).astype(n

    0热度

    1回答

    我刚刚开始使用pyopencl模块查看python中的OpenCl。 我有兴趣生成没有任何输入的东西,例如生成正弦波的样本。 要做到这一点,我需要的只是全局ID来进行计算,但是返回全局ID会导致一些奇特的数字。我用下面的代码: import numpy as np import pyopencl as cl Size = Width*Height # Get platforms, bot

    0热度

    1回答

    我试图用PyOpenCL作出一个减少总和,类似于这个例子:https://dournac.org/info/gpu_sum_reduction。我试图对所有值为1的矢量求和。第一个元素的结果应该是16384。但是,似乎只有一些要点正在收集。是否需要本地索引?是否有任何竞争条件(当我运行两次结果是不一样的)?下面的代码有什么问题? import numpy as np import pyopenc

    0热度

    1回答

    我编程OpenCL通过在Ubuntu 16.04.3 64位上的pyopenCL,在Nvidia的Tesla K10.G2.8GB上的 。 到目前为止,只要我没有在我的OpenCL内核中包含头文件,任何东西都可以平稳运行。一旦,因为我把#include <stdlib.h>我的头文件的顶部,我的OpenCL内核的编译失败与不同的文件丢失,在他们之中是 gnu/stubs-32.h sys/cde

    1热度

    1回答

    我试图将numpy数组作为opencl向量的数组传递给内核。 (np.int32 - > int3 *的numpy数组) 但结果似乎是weired。 如果有人解释它为什么会发生,我们将非常感激。 在此先感谢。 的源代码: import pyopencl as cl import numpy as np platforms = cl.get_platforms() ctx = cl.Cont

    0热度

    1回答

    我正在学习在python中使用opencl,我想优化一个函数。我了解到,这可以通过将全局内存存储在本地内存中来完成。然而,它不应该像它应该那样工作,持续时间是其两倍。这做得好吗?我可以更优化此代码吗? __kernel void sumOP( __global float *input, __global float *weights, int layer_si

    0热度

    1回答

    谁能告诉我为什么OpenCL告诉我,我的Nvidia Geforce GTX 970只有13个最大计算单位?另外,最大计算单位是否等于执行单位(EU)?因为在我的Iris 6100笔记本电脑上,device.max_compute_units是48,与图形卡的EU相同。 import pyopencl as cl platform = cl.get_platforms()[0] device

    1热度

    1回答

    我真的是OpenCL的新手。我已经从这个网站获取了示例代码:http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614?pgno=2,我已经对它进行了一些定制。我的目标是向内核发送一个填充1个数字的4x4矩阵,并从内核恢复它。我知道这是一个微不足道的代码,但我需要这样做来了解OpenCL的工作原理。输入矩阵是这一个: [