2013-03-08 59 views
7

我对numpy的广播规则有些困惑。假设你想执行一个更高维数组的轴明智的数量积可以降低1阵列空间维度(基本上执行沿一个轴的加权和):Numpy Array不同维度的广播

from numpy import * 

A = ones((3,3,2)) 
v = array([1,2]) 

B = zeros((3,3)) 

# V01: this works 
B[0,0] = v.dot(A[0,0]) 

# V02: this works 
B[:,:] = v[0]*A[:,:,0] + v[1]*A[:,:,1] 

# V03: this doesn't 
B[:,:] = v.dot(A[:,:]) 

为什么V03不行?

干杯

回答

4

np.dot(a, b)over the last axis of a and the second-to-last of b操作。所以对于你的问题你的具体情况,你总是可以去:

>>> a.dot(v) 
array([[ 3., 3., 3.], 
     [ 3., 3., 3.], 
     [ 3., 3., 3.]]) 

如果你想保持v.dot(a)顺序,你需要得到轴到位,它可以很容易地与np.rollaxis实现:

>>> v.dot(np.rollaxis(a, 2, 1)) 
array([[ 3., 3., 3.], 
     [ 3., 3., 3.], 
     [ 3., 3., 3.]]) 

我不喜欢np.dot太多,除非它是明显的矩阵或向量乘法,因为它使用可选out参数时是非常严格的输出D型。 Joe Kington已经提到过它,但是如果你打算做这种事情,那就习惯np.einsum:一旦你掌握了这个语法,它就会减少你花费在重塑事物上的时间最低:

>>> a = np.ones((3, 3, 2)) 
>>> np.einsum('i, jki', v, a) 
array([[ 3., 3., 3.], 
     [ 3., 3., 3.], 
     [ 3., 3., 3.]]) 

不在于它是在这种情况下也有关,但它也快得离谱:

In [4]: %timeit a.dot(v) 
100000 loops, best of 3: 2.43 us per loop 

In [5]: %timeit v.dot(np.rollaxis(a, 2, 1)) 
100000 loops, best of 3: 4.49 us per loop 

In [7]: %timeit np.tensordot(v, a, axes=(0, 2)) 
100000 loops, best of 3: 14.9 us per loop 

In [8]: %timeit np.einsum('i, jki', v, a) 
100000 loops, best of 3: 2.91 us per loop 
2

您可以使用numpy.apply_along_axis()此:

In [35]: np.apply_along_axis(v.dot, 2, A) 
Out[35]: 
array([[ 3., 3., 3.], 
     [ 3., 3., 3.], 
     [ 3., 3., 3.]]) 

究其原因,我认为V03不起作用的是,它没有什么不同来:

B[:,:] = v.dot(A) 

即它试图计算沿着A的最外轴的点积。

3

在这种特殊情况下,您也可以使用tensordot

import numpy as np 

A = np.ones((3,3,2)) 
v = np.array([1,2]) 

print np.tensordot(v, A, axes=(0, 2)) 

这产生了:

array([[ 3., 3., 3.], 
     [ 3., 3., 3.], 
     [ 3., 3., 3.]]) 

axes=(0,2)表明tensordot应该总结以上在v第一轴线和在A第三轴线。 (也有看einsum,这是更灵活,但很难理解,如果你不习惯的符号。)

如果速度是一个考虑因素,tensordot比使用apply_along_axes为小数组相当快。

In [14]: A = np.ones((3,3,2)) 

In [15]: v = np.array([1,2]) 

In [16]: %timeit np.tensordot(v, A, axes=(0, 2)) 
10000 loops, best of 3: 21.6 us per loop 

In [17]: %timeit np.apply_along_axis(v.dot, 2, A) 
1000 loops, best of 3: 258 us per loop 

(所不同的是对于大型阵列不太明显由于恒定的开销,虽然tensordot是一致更快。)

+0

我发现numpy的tensordot轴完全混乱。你能详细说明吗?我想通过一个(3,5)张量来多重(10,3,2)张量来得到一个(2)张量。 – Bob 2015-12-22 22:31:15