numpy的重复用于给定两个阵列2D阵列

，说numpy的重复用于给定两个阵列2D阵列

arr = array([10, 24, 24, 24, 1, 21, 1, 21, 0, 0], dtype=int32) 
rep = array([3, 2, 2, 0, 0, 0, 0, 0, 0, 0], dtype=int32)

np.repeat（ARR，REP）返回

array([10, 10, 10, 24, 24, 24, 24], dtype=int32)

是否有任何方式来复制此功能的一组2D阵列？

是给予

arr = array([[10, 24, 24, 24, 1, 21, 1, 21, 0, 0], 
      [10, 24, 24, 1, 21, 1, 21, 32, 0, 0]], dtype=int32) 
rep = array([[3, 2, 2, 0, 0, 0, 0, 0, 0, 0], 
      [2, 2, 2, 0, 0, 0, 0, 0, 0, 0]], dtype=int32)

是否有可能创造出一个矢量化功能？

PS：每行重复次数不必相同。我填充每个结果行以确保它们具有相同的大小。

def repeat2d(arr, rep): 
    # Find the max length of repetitions in all the rows. 
    max_len = rep.sum(axis=-1).max() 
    # Create a common array to hold all results. Since each repeated array will have 
    # different sizes, some of them are padded with zero. 
    ret_val = np.empty((arr.shape[0], maxlen)) 
    for i in range(arr.shape[0]): 
     # Repeated array will not have same num of cols as ret_val. 
     temp = np.repeat(arr[i], rep[i]) 
     ret_val[i,:temp.size] = temp 
    return ret_val

我知道np.vectorize，并且我知道它不会给普通版本带来任何性能优势。

来源

2016-10-16 Aditya369

所以你有不同的每行重复数组？但每行重复的总数是相同的？

只需在平面阵列上执行repeat，然后重新变形为正确的行数。

In [529]: np.repeat(arr,rep.flat) 
Out[529]: array([10, 10, 10, 24, 24, 24, 24, 10, 10, 24, 24, 24, 24, 1]) 
In [530]: np.repeat(arr,rep.flat).reshape(2,-1) 
Out[530]: 
array([[10, 10, 10, 24, 24, 24, 24], 
     [10, 10, 24, 24, 24, 24, 1]])

如果每行重复次数不同，我们有填充可变长度行的问题。这出现在其他SO问题中。我不记得所有的细节，但我认为解决的办法是沿着这条线：

变化rep这样的数字有所不同：

In [547]: rep 
Out[547]: 
array([[3, 2, 2, 0, 0, 0, 0, 0, 0, 0], 
     [2, 2, 2, 1, 0, 2, 0, 0, 0, 0]]) 
In [548]: lens=rep.sum(axis=1) 
In [549]: lens 
Out[549]: array([7, 9]) 
In [550]: m=np.max(lens) 
In [551]: m 
Out[551]: 9

创建目标：

In [552]: res = np.zeros((arr.shape[0],m),arr.dtype)

创建索引阵列 - 需要制定的细节：

In [553]: idx=np.r_[0:7,m:m+9] 
In [554]: idx 
Out[554]: array([ 0, 1, 2, 3, 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16, 17])

flat indexed assi gnment：

In [555]: res.flat[idx]=np.repeat(arr,rep.flat) 
In [556]: res 
Out[556]: 
array([[10, 10, 10, 24, 24, 24, 24, 0, 0], 
     [10, 10, 24, 24, 24, 24, 1, 1, 1]])

来源

2016-10-16 00:34:37 hpaulj

每行重复的总数不必相同。这就是为什么我找到maxlen，然后填充每一行的大小相同。 – Aditya369

你正在填充随机'空'值？我见过可以处理可变长度行的蒙版插入，但不记得细节。 – hpaulj

是的。我用随机的空值填充它们。尽管在我的情况下填充零点更有意义。 – Aditya369

另一个类似@ hpaulj的解决方案：

def repeat2dvect(arr, rep): 
    lens = rep.sum(axis=-1) 
    maxlen = lens.max() 
    ret_val = np.zeros((arr.shape[0], maxlen)) 
    mask = (lens[:,None]>np.arange(maxlen)) 
    ret_val[mask] = np.repeat(arr.ravel(), rep.ravel()) 
    return ret_val

而是存储索引中，我创建一个布尔面膜用掩膜设定值。

来源

2016-10-16 03:17:33 Aditya369

numpy的重复用于给定两个阵列2D阵列

回答

相关问题