2014-09-13 57 views
16

我想获取与某行匹配的二维Numpy数组的索引。例如,我的数组是这样的:在二维numpy数组中查找匹配的行

vals = np.array([[0, 0], 
       [1, 0], 
       [2, 0], 
       [0, 1], 
       [1, 1], 
       [2, 1], 
       [0, 2], 
       [1, 2], 
       [2, 2], 
       [0, 3], 
       [1, 3], 
       [2, 3], 
       [0, 0], 
       [1, 0], 
       [2, 0], 
       [0, 1], 
       [1, 1], 
       [2, 1], 
       [0, 2], 
       [1, 2], 
       [2, 2], 
       [0, 3], 
       [1, 3], 
       [2, 3]]) 

我想获得该行相匹配的指数[0,1],这是指数3和15当我不喜欢的东西numpy.where(vals == [0 ,1])我得到...

(array([ 0, 3, 3, 4, 5, 6, 9, 12, 15, 15, 16, 17, 18, 21]), array([0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0])) 

我想索引数组([3,15])。

回答

18

您需要np.where函数来获得指标:

>>> np.where((vals == (0, 1)).all(axis=1)) 
(array([ 3, 15]),) 

要拆散:

>>> vals == (0, 1) 
array([[ True, False], 
     [False, False], 
     ... 
     [ True, False], 
     [False, False], 
     [False, False]], dtype=bool) 

,并呼吁该阵列上的.all方法(与axis=1)为您提供True其中两个为真:

>>> (vals == (0, 1)).all(axis=1) 
array([False, False, False, True, False, False, False, False, False, 
     False, False, False, False, False, False, True, False, False, 
     False, False, False, False, False, False], dtype=bool) 

,并获得该指标为True

>>> np.where((vals == (0, 1)).all(axis=1)) 
(array([ 3, 15]),) 

我发现我的解决方案更具可读性,但正如unutbu指出的那样,以下可能会更快,并返回相同的值(vals == (0, 1)).all(axis=1)

>>> (vals[:, 0] == 0) & (vals[:, 1] == 1) 
3
In [5]: np.where((vals[:,0] == 0) & (vals[:,1]==1))[0] 
Out[5]: array([ 3, 15]) 

我不知道为什么,但这是显著快于
np.where((vals == (0, 1)).all(axis=1))

In [34]: vals2 = np.tile(vals, (1000,1)) 

In [35]: %timeit np.where((vals2 == (0, 1)).all(axis=1))[0] 
1000 loops, best of 3: 808 µs per loop 

In [36]: %timeit np.where((vals2[:,0] == 0) & (vals2[:,1]==1))[0] 
10000 loops, best of 3: 152 µs per loop 
3

使用numpy_indexed包,你可以简单的写:

import numpy_indexed as npi 
print(np.flatnonzero(npi.contains([[0, 1]], vals)))