2015-05-07 42 views
3

我有一个形状(n,d)的矩阵Y.我已经计算出下列方式两两行的差别:在三维阵列中放入矩阵行的成对差异

I, J = np.triu_indices(Y.shape[0], 0) 
rowDiffs = (Y[I, :] - Y[J, :]) 

不,我想创建一个三维数组,其中包含的行的差异我在位置(I,Jÿj的,:) 。你会怎么做?

的它的目的是,以取代此低效循环:

for i in range(Y.shape[0]): 
     for j in range(Y.shape[0]): 
      C[i,:] = C[i,:] + W[i, j] * (Y[i, :]-Y[j, :]) 

回答

1

我已经发现了一些成功与此:

row_diffs = Y[:, np.newaxis] - Y 

Y[:, np.newaxis]创建具有尺寸(N,1的一个版本的Y, 3)。然后,减法使用broadcasting来做你想做的事。

不幸的是,我发现这种方法相对较慢,我还没有找到更好的方法。

完整的示例:

>>> x = np.random.randint(10, size=(4, 3)) 
>>> x 
array([[4, 0, 8], 
     [8, 5, 3], 
     [4, 1, 6], 
     [2, 2, 4]]) 
>>> x[:, np.newaxis] - x 
array([[[ 0, 0, 0], 
     [-4, -5, 5], 
     [ 0, -1, 2], 
     [ 2, -2, 4]], 

     [[ 4, 5, -5], 
     [ 0, 0, 0], 
     [ 4, 4, -3], 
     [ 6, 3, -1]], 

     [[ 0, 1, -2], 
     [-4, -4, 3], 
     [ 0, 0, 0], 
     [ 2, -1, 2]], 

     [[-2, 2, -4], 
     [-6, -3, 1], 
     [-2, 1, -2], 
     [ 0, 0, 0]]]) 
0

下面是使用broadcastingnp.einsum一个量化的方法 -

np.einsum('ij,ijk->ik',W,Y[:,None] - Y) 

运行测试 -

In [29]: def original_app(Y,W): 
    ...:  m = Y.shape[0] 
    ...:  C = np.zeros((m,m)) 
    ...:  for i in range(Y.shape[0]): 
    ...:   for j in range(Y.shape[0]): 
    ...:    C[i,:] = C[i,:] + W[i, j] * (Y[i, :]-Y[j, :]) 
    ...:  return C 
    ...: 

In [30]: # Inputs 
    ...: Y = np.random.rand(100,100) 
    ...: W = np.random.rand(100,100) 
    ...: 

In [31]: out = original_app(Y,W) 

In [32]: np.allclose(out, np.einsum('ij,ijk->ik',W,Y[:,None] - Y)) 
Out[32]: True 

In [33]: %timeit original_app(Y,W) 
10 loops, best of 3: 70.8 ms per loop 

In [34]: %timeit np.einsum('ij,ijk->ik',W,Y[:,None] - Y) 
100 loops, best of 3: 4.01 ms per loop