你可以使用einsum:
In [21]: np.einsum('ijkl->kl', M)
Out[21]:
array([[32, 8],
[16, 8]])
其他选项包括重塑第一两个轴成一个轴,然后调用sum
:
In [24]: M.reshape(-1, 2, 2).sum(axis=0)
Out[24]:
array([[32, 8],
[16, 8]])
或调用的总和方法两次:
In [26]: M.sum(axis=0).sum(axis=0)
Out[26]:
array([[32, 8],
[16, 8]])
但是用np.einsum
更快:
In [22]: %timeit np.einsum('ijkl->kl', M)
100000 loops, best of 3: 2.42 µs per loop
In [25]: %timeit M.reshape(-1, 2, 2).sum(axis=0)
100000 loops, best of 3: 5.69 µs per loop
In [43]: %timeit np.sum(M, axis=(0,1))
100000 loops, best of 3: 6.08 µs per loop
In [33]: %timeit sum(sum(M))
100000 loops, best of 3: 8.18 µs per loop
In [27]: %timeit M.sum(axis=0).sum(axis=0)
100000 loops, best of 3: 9.83 µs per loop
注意:由于许多因素(操作系统,NumPy版本,NumPy库,硬件等),timeit基准可能会有很大差异。各种方法的相对性能有时也取决于M的大小。因此,在M上进行自己的基准测试是值得的,它更接近您的实际使用情况。
例如,对于稍大阵列M
,调用sum
方法两次可以是最快的:
In [34]: M = np.random.random((100,100,2,2))
In [37]: %timeit M.sum(axis=0).sum(axis=0)
10000 loops, best of 3: 59.9 µs per loop
In [39]: %timeit np.einsum('ijkl->kl', M)
10000 loops, best of 3: 99 µs per loop
In [40]: %timeit np.sum(M, axis=(0,1))
10000 loops, best of 3: 182 µs per loop
In [36]: %timeit M.reshape(-1, 2, 2).sum(axis=0)
10000 loops, best of 3: 184 µs per loop
In [38]: %timeit sum(sum(M))
1000 loops, best of 3: 202 µs per loop
与'sum(sum(M))'(由Cyber回答)相比,'np.einsum'更快吗? –
我为'sum(sum(M))'添加了timeit基准。请注意,由于许多因素(OS,NumPy版本,NumPy库,硬件等),timeit基准测试可能会有很大差异。各种方法的相对性能有时也取决于'M'的大小。因此,在与您的实际使用情况更接近的'M'上执行您自己的基准测试是值得的。 – unutbu
我怀疑这取决于M的大小(一些快速实验给出的结果违背了我的直觉,但是,我不能相信它们。) – DSM