2012-10-22 55 views
8

我需要遍历2560x2160 2D numpy阵列(图像)的每个像素。我的问题的简化版本如下:更快速地循环遍历Python中图像的每个像素?

import time 
import numpy as np 

t = time.clock() 
limit = 9000 
for (x,y), pixel in np.ndenumerate(image): 
    if(pixel > limit) 
     pass 
tt = time.clock() 
print tt-t 

这是一个令人讨厌的~30秒完成在我的电脑上。 (酷睿i7,8GB RAM) 有更快的方式来执行这个循环与一个内部'如果'的声明?我只对超过某个限制的像素感兴趣,但我确实需要它们的(x,y)指数和值。

回答

13

使用布尔矩阵:

x, y = (image > limit).nonzero() 
vals = image[x, y] 
+1

WOW!我的眼睛被打开了。取<0.1秒。 – dinkelk

+0

x和y这里是什么? –

+1

@AndrewHundt:'x'和'y'分别是非零点的x和y索引数组。 – nneonneo

6

首先,尝试使用矢量化计算:

i, j = np.where(image > limit) 

如果你的问题不能由矢量化计算解决,您可以加速比for循环:

for i in xrange(image.shape[0]): 
    for j in xrange(image.shape[1]): 
     pixel = image.item(i, j) 
     if pixel > limit: 
      pass 

或:

from itertools import product 
h, w = image.shape 
for pos in product(range(h), range(w)): 
    pixel = image.item(pos) 
    if pixel > limit: 
     pass 

numpy.ndenumerate很慢,通过使用正常for循环并从数组中获取值item方法可以使循环加速4倍。

如果您需要更多速度,请尝试使用Cython,它会使您的代码与C代码一样快。