Numpy：使用相邻元素的平均值替换阵列中的每个值

我有一个ndarray，我想用相邻元素的平均值替换数组中的每个值。下面的代码可以完成这项工作，但是当我有700个具有形状（7000,7000）的阵列时，它会超级慢，所以我想知道是否有更好的方法来完成它。谢谢！Numpy：使用相邻元素的平均值替换阵列中的每个值

a = np.array(([1,2,3,4,5,6,7,8,9],[4,5,6,7,8,9,10,11,12],[3,4,5,6,7,8,9,10,11])) 
row,col = a.shape 
new_arr = np.ndarray(a.shape) 
for x in xrange(row): 
    for y in xrange(col): 
     min_x = max(0, x-1) 
     min_y = max(0, y-1) 
     new_arr[x][y] = a[min_x:(x+2),min_y:(y+2)].mean() 
print new_arr

来源

2016-07-06 Chiefscreation

它对我来说运行得不是很慢，也没有看起来应该慢慢运行。 –

@EliSadoff它将如果我有700阵列形状（7000,7000）... – Chiefscreation

我不知道如何在python中做到这一点，但你有没有考虑过多线程或并行处理？我知道在C中可以这样做来加速大数据处理。 – Michael

嗯，这是一个smoothing operation in image processing，可与2D卷积来实现。你对边界元素的工作方式有点不同。因此，如果边界元素都不放过精密，你可以使用scipy's convolve2d像这样 -

from scipy.signal import convolve2d as conv2 

out = (conv2(a,np.ones((3,3)),'same')/9.0

这具体操作是内置在OpenCV的模块cv2.blur，是它非常有效。该名称基本上描述了其模糊输入数组表示图像的操作。我相信效率来自于这样一个事实，即它在内部完全用C来实现，因为它使用一个很薄的Python封装来处理NumPy数组。

因此，输出可以或者用它来计算，像这样 -

import cv2 # Import OpenCV module 

out = cv2.blur(a.astype(float),(3,3))

这里有一个关于时机的快速摊牌一个体面的大图像/阵列上 -

In [93]: a = np.random.randint(0,255,(5000,5000)) # Input array 

In [94]: %timeit conv2(a,np.ones((3,3)),'same')/9.0 
1 loops, best of 3: 2.74 s per loop 

In [95]: %timeit cv2.blur(a.astype(float),(3,3)) 
1 loops, best of 3: 627 ms per loop

来源

2016-07-06 20:00:42 Divakar

很好地完成了。我正要写这样的东西。 +1。 – rayryeng

@rayryeng很高兴见到你与NumPy标签！ ;） – Divakar

@Divakar这是在我的饲料:)我最近没有回答问题，虽然...很多东西在我的最后。 – rayryeng

继与@Divakar讨论，发现在scipy中存在的不同卷积方法的比较：

import numpy as np 
from scipy import signal, ndimage 

def conv2(A, size): 
    return signal.convolve2d(A, np.ones((size, size)), mode='same')/float(size**2) 

def fftconv(A, size): 
    return signal.fftconvolve(A, np.ones((size, size)), mode='same')/float(size**2) 

def uniform(A, size): 
    return ndimage.uniform_filter(A, size, mode='constant')

所有3种方法的返回值完全相同。但是请注意，uniform_filter的参数mode='constant'表示滤波器的边界条件，constant == 0与傅里叶域（在其他两种方法中）的执行方式相同。对于不同的用例，您可以更改边界条件。

现在一些测试矩阵：

A = np.random.randn(1000, 1000)

和一些计时：

%timeit conv2(A, 3)  # 33.8 ms per loop 
%timeit fftconv(A, 3) # 84.1 ms per loop 
%timeit uniform(A, 3) # 17.1 ms per loop 

%timeit conv2(A, 5)  # 68.7 ms per loop 
%timeit fftconv(A, 5) # 92.8 ms per loop 
%timeit uniform(A, 5) # 17.1 ms per loop 

%timeit conv2(A, 10)  # 210 ms per loop 
%timeit fftconv(A, 10) # 86 ms per loop 
%timeit uniform(A, 10) # 16.4 ms per loop 

%timeit conv2(A, 30)  # 1.75 s per loop 
%timeit fftconv(A, 30) # 102 ms per loop 
%timeit uniform(A, 30) # 16.5 ms per loop

因此，在短期，uniform_filter似乎更快，这是因为两个convolution is separable 1D convolutons（类似于gaussian_filter这是也可分离）。

使用signal模块（@ Divakar中的模块）解决方案时，具有不同内核的其他不可分离滤波器更有可能更快。

两个fftconvolve和uniform_filter的速度仍然是不同的内核尺寸不变，而convolve2d得稍微慢一些。

来源

2016-07-06 20:30:29

好的发现！现在消化所有这些东西。 – Divakar

@Divakar刚刚发现一些非常有趣的事情，针对不同的* small *内核大小，最后2个方法保持* constant *执行时间。 –

我想我通过两个通道来理解uniform_filter的实现过程。但是'fftconvolve'的内部实现看起来很乱。再次感谢您提出这些有用的发现！ – Divakar

我最近有一个类似的问题，必须找到不同的解决方案，因为我不能使用SciPy的。

import numpy as np 

a = np.random.randint(100, size=(7000,7000)) #Array of 7000 x 7000 
row,col = a.shape 

column_totals = a.sum(axis=0) #Dump the sum of all columns into a single array 

new_array = np.zeros([row,col]) #Create an receiving array 

for i in range(row): 
    #Resulting row = the value of all rows minus the orignal row, divided by the row number minus one. 
    new_array[i] = (column_totals - a[i])/(row - 1) 

print(new_array)

来源

2017-08-17 20:58:03 GeorgeLPerkins

Numpy：使用相邻元素的平均值替换阵列中的每个值

回答

相关问题