2011-07-18 160 views
8

我有两个20x100x3 NumPy阵列,我想组合成一个40 x 100 x 3阵列,也就是说,只需在阵列中添加更多行。我很困惑我想要什么功能:它是vstack,hstack,column_stack还是其他的东西?组合NumPy阵列

回答

23

我相信这是你想要vstack

p=array_2 
q=array_2 
p=numpy.vstack([p,q]) 
+0

不确定为什么我第一次访问该页面时没有显示您的答案。 +1用于首先推荐vstack。 – JoshAdel

+0

请注意,文档建议现在使用'stack'或'concatenate',并且vstack仅支持向后兼容性,请参阅:https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/ numpy.vstack.html – NOhs

13

一的学习实验的最佳方式,但我要说你想np.vstack虽然有做同样的事情的其他方式:

a = np.ones((20,100,3)) 
b = np.vstack((a,a)) 

print b.shape # (40,100,3) 

b = np.concatenate((a,a),axis=0) 

编辑

正如一个音符,我的机器在OP的问题大小的数组,我发现np.concatenate大约为2x比np.vstack

In [172]: a = np.random.normal(size=(20,100,3)) 

In [173]: c = np.random.normal(size=(20,100,3)) 

In [174]: %timeit b = np.concatenate((a,c),axis=0) 
100000 loops, best of 3: 13.3 us per loop 

In [175]: %timeit b = np.vstack((a,c)) 
10000 loops, best of 3: 26.1 us per loop 
+0

奇怪,但谢谢,现在我可以留下第一个评论。 – Giltech

+0

我可能是,在这里很愚蠢,因为我没有多少时间使用timeit,但是连接起来不会占用10倍的循环吗? – Giltech

+1

@Giltech,而timeit使用10倍以上的循环来测试'np.concatenate'(它似乎自动选择这个),这里的重要数字是每个循环的时间 – JoshAdel

9

快可能是值得一提的

np.concatenate((a1, a2, ...), axis=0) 

是一般形式,vstack和hstack是特定情况。我发现最简单的方法就是知道我想堆叠哪个维度,并将其作为np.concatenate的参数提供。

3

顺便说一句,还有r_

>>> from scipy import * 
>>> a = rand(20,100,3) 
>>> b = rand(20,100,3) 
>>> a.shape 
(20, 100, 3) 
>>> b.shape 
(20, 100, 3) 
>>> r_[a,b].shape 
(40, 100, 3) 
>>> (r_[a,b] == vstack([a,b])).all() 
True 
4

我试图R_和vstack和结果之间的一个小Benchmark是很有意思:

import numpy as np 

NCOLS = 10 
NROWS = 2 
NMATRICES = 10000 

def mergeR(matrices): 
    result = np.zeros([0, NCOLS]) 

    for m in matrices: 
     result = np.r_[ result, m] 

def mergeVstack(matrices): 
    result = np.vstack(matrices) 

def main(): 
    matrices = tuple(np.random.random([NROWS, NCOLS]) for i in xrange(NMATRICES)) 
    mergeR(matrices) 
    mergeVstack(matrices) 

    return 0 

if __name__ == '__main__': 
    main() 

然后我跑探查:

python -m cProfile -s cumulative np_merge_benchmark.py 

和结果:

ncalls tottime percall cumtime percall filename:lineno(function) 
... 
    1 0.579 0.579 4.139 4.139 np_merge_benchmark.py:21(mergeR) 
... 
    1 0.000 0.000 0.054 0.054 np_merge_benchmark.py:27(mergeVstack) 

所以vstack的方式是77倍快!