有没有办法使用numpy去除循环？

我有一个3D numpy数组input_data（q x m x n），我正在使用它来创建直方图数据以最终绘制，它存储在plot_data（m x n x 2）中。这一步在我的流程中是一个体面的瓶颈，我想知道是否有更快，更“粗糙”的做法。有没有办法使用numpy去除循环？

num_bins = 3 
for i in range(m): 

    for j in range(n): 

     data = input_data[:, i, j] 

     hist, bins = np.histogram(data, bins=num_bins) 

     # Create the (x, y) pairs to plot 
     plot_data[i][j] = np.stack((bins[:-1], hist), axis=1)

来源

2017-10-11 holtc

更快你的意思是更简洁吗？ –

更快的意义运行时间，所以理想地利用numpy的矢量化能力，类似于使用np.sum（）计算总和而不是循环并手动计算 – holtc

因此，我查找了一些信息。也许，这个scipy网站会是你想要的？我发现以下内容： https://docs.scipy.org/doc/numpy-1.13.0/reference/arrays.nditer.html – Maderas

我认为你的样本是相似的，所以直方图是相似的。在这种情况下，您可以简化比较，做一个更加量化的方式：

a=np.random.rand(100000,10,10) 


def f(): # roughly your approach. 
    plotdata=np.zeros((10,10,3),np.int32) 
    for i in range(10): 
     for j in range(10): 
      bins,hist=np.histogram(a[:,i,j],3) 
      plotdata[i,j]=bins 
    return plotdata 

def g(): #vectored comparisons 
    u=(a < 1/3).sum(axis=0) 
    w=(a > 2/3).sum(axis=0) 
    v=len(a)-u-w 
    return np.dstack((u,v,w))

对于一个8倍的改进：

In [213]: %timeit f() 
548 ms ± 15.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each) 

In [214]: %timeit g() 
77.7 ms ± 5.46 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

来源

2017-10-11 19:52:41

不幸的是，我们不能这样简化，我们需要真实的数据 – holtc

下面是箱的通用号码一个量化的方法 -

def vectorized_app(input_data, num_bins): 
    s0 = input_data.min(0) 
    s1 = input_data.max(0) 

    m,n,r = input_data.shape 
    ids = (num_bins*((input_data - s0)/(s1-s0))).astype(int).clip(max=num_bins-1) 
    offset = num_bins*(r*np.arange(n)[:,None] + np.arange(r)) 
    ids3D = ids + offset 
    count3D = np.bincount(ids3D.ravel(), minlength=n*r*num_bins).reshape(n,r,-1) 
    bins3D = create_ranges_nd(s0, s1, num_bins+1)[...,:-1] 

    out = np.empty((n,r,num_bins,2)) 
    out[...,0] = bins3D 
    out[...,1] = count3D 
    return out

辅助功能（s） -

# https://stackoverflow.com/a/46694364/ @Divakar 
def create_ranges_nd(start, stop, N, endpoint=True): 
    if endpoint==1: 
     divisor = N-1 
    else: 
     divisor = N 
    steps = (1.0/divisor) * (stop - start) 
    return start[...,None] + steps[...,None]*np.arange(N)

运行测试

原始的方法 -

def org_app(input_data, num_bins): 
    q,m,n = input_data.shape 
    plot_data = np.zeros((m,n,num_bins,2)) 
    for i in range(m): 
     for j in range(n): 
      data = input_data[:, i, j] 
      hist, bins = np.histogram(data, bins=num_bins) 
      plot_data[i][j] = np.stack((bins[:-1], hist), axis=1) 
    return plot_data

时序和验证 -

让我们测试出形状(100, 100, 100)的大型数据阵列上，并与框的数目为10：

In [967]: # Setup input 
    ...: num_bins = 10 
    ...: m = 100 
    ...: n = 100 
    ...: q = 100 
    ...: input_data = np.random.rand(q,m,n) 
    ...: 
    ...: out1 = org_app(input_data, num_bins) 
    ...: out2 = vectorized_app(input_data, num_bins) 
    ...: print np.allclose(out1, out2) 
    ...: 
True 

In [968]: %timeit org_app(input_data, num_bins) 
1 loop, best of 3: 748 ms per loop 

In [969]: %timeit vectorized_app(input_data, num_bins) 
100 loops, best of 3: 12.7 ms per loop 

In [970]: 748/12.7 # speedup with vectorized one over original 
Out[970]: 58.89763779527559

来源

2017-10-11 19:54:58 Divakar

这与在大型3d阵列上的for循环相比，性能如何？ – holtc

@holtc增加了假设随机数的形状（100,100,100）和箱数= 10。 – Divakar

因此，当我在我的真实数据上运行这个时，np.allclose（）是错误的，因为我正在碰撞所有我的方法，实际上速度较慢，所以不幸我无法使用此功能。在我的例子中，input_data的数量是（100000,8,360），最多100个bin – holtc

有没有办法使用numpy去除循环？

回答

相关问题