numba

    -3热度

    1回答

    我是Numba的新手,并且正在努力加速一些已经证明对于numpy来说过于笨拙的计算。我在下面给出的例子比较了一个包含我的计算子集的函数,该函数使用向量化/ numpy和函数的numba版本,后者也通过评论@autojit装饰器测试为纯python。 我发现numba和numpy版本相对于纯python提供了类似的加速,这两者都是大约10倍速度改进的因素。 numpy版本实际上比我的numba函数稍

    4热度

    1回答

    我正在研究需要快速协程的东西,我相信numba可以加速我的代码。 下面是一个愚蠢的例子:一个函数,它的输入平方,并增加了它被调用的次数。 def make_square_plus_count(): i = 0 def square_plus_count(x): nonlocal i i += 1 return x**2 + i re

    3热度

    1回答

    我一直在使用Numba包测试一些基本的CUDA函数。我的主要目标是在GPU上实现一个Richardson-Lucy算法。它可以加速这样做可以归纳为以下伪功能 def dummy(arr1, arr2): return (arr1 * arr2).sum()/((arr2**2).sum() + eps) 这个功能相当快速运行的CPU上,但我希望把一切都在GPU上的算法的主要步骤之一避

    1热度

    1回答

    是否可以在@jit(nopython = True)函数中创建NPDatetime对象?从我所知道的,初始化这些对象需要使用字符串对象,这似乎阻止了nopython函数的编译。

    4热度

    2回答

    我创建了一个新的畅达环境 [email protected]:~/project$ conda create -n test-env -c numba python=3.5.2 llvmdev=3.8 Fetching package metadata ........... Solving package specifications: . Package plan for instal

    0热度

    1回答

    我尝试用numba来使用cuda python。 代码是计算1D数组的总和如下,但我不知道如何得到一个值的结果,而不是三个值。 python3.5与numba + CUDA8.0 import os,sys,time import pandas as pd import numpy as np from numba import cuda, float32 os.environ['NUM

    0热度

    1回答

    我有一个可以通过Numba解决的问题:为查询服务器创建Numpy ufuncs,以便(a)将简单操作合并为一次数据传输,减少我的#1热点(内存带宽)和(b)将第三方C函数作为ufuncs即时打包,为查询系统的用户提供更多功能。 我有一个累加器节点,它分割查询并收集实际运行Numpy(网络中不同的计算机)的结果和计算节点。如果Numba编译发生在计算节点上,它将会重复工作,因为它们针对同一查询在不同

    2热度

    1回答

    我试图比较使用基本示例的numba和纯python,并且得到了奇怪的结果。 这是numba例如: from numba import jit from numpy import arange from time import time # jit decorator tells Numba to compile this function. # The argument types wil

    3热度

    2回答

    从numba网站: from numba import jit @jit def f(x, y): # A somewhat trivial example return x + y 有没有办法有numba使用Python类型提示(如果有的话)?

    1热度

    1回答

    所以我没有按照numba开发一段时间,我发现了很多令人兴奋的事情,如@jitclass和列表支持。 所以我想尝试一下,但如果我尝试在一个nopython块我jitclass结构的名单,我得到的错误: reflected list(instance.jitclass.Interval#42f9788<lo:float64,hi:float64>): unsupported nested memory