pyopencl

    4热度

    2回答

    我有一个问题:快速线性系统求解(我有很多这样的系统)。我将使用GPU和OpenCL来解决它。 我喜欢动态语言如Ruby或Python,我得到了使用低级语言,比如C.的习惯了 所以,我有两个同时发生的目标: 制定这样的OpenCL解决方案以尽可能少的努力尽可能快地解决线性系统。 不要在性能上松动很多。为了方便起见,我不希望支付2-10倍的减速,但我已经准备好用高级语言支付30-50%的费用。 对我来

    0热度

    2回答

    更新:在我的内核int4是错误的。 我正在使用pyopencl,但无法使结构对齐正常工作。在下面调用内核两次的代码中,b值正确返回(如1),但c值有一些“随机”值。 换句话说:我想读一个结构的两个成员。我可以阅读第一个,但不是第二个。为什么? 无论我使用numpy结构化数组还是使用struct打包,都会发生同样的问题。并且评论中的_-attribute__设置也没有帮助。 我怀疑我在代码的其他地方

    14热度

    2回答

    我曾在几个项目上与OpenCL合作过,但一直将内核编写为一个(有时很大)的函数。现在我正在研究一个更复杂的项目,并希望在多个内核之间共享函数。 但我能找到的所有例子都显示内核为单个文件(很少有甚至调用辅助函数)。似乎应该可以使用多个文件 - clCreateProgramWithSource()接受多个字符串(并且将它们结合起来,我假设) - 虽然pyopencl的Program()只接受单一来源