2017-08-26 108 views
2

假设我有一个numpy的阵列让numpy的矩阵更稀疏

np.array([ 
    [3, 0, 5, 3, 0, 1], 
    [0, 1, 2, 1, 5, 2], 
    [4, 3, 5, 3, 1, 4], 
    [2, 5, 2, 5, 3, 1], 
    [0, 1, 2, 1, 5, 2], 
]) 

现在,我想随机替换0。所以一些元素,我有这样的

np.array([ 
    [3, 0, 0, 3, 0, 1], 
    [0, 1, 2, 0, 5, 2], 
    [0, 3, 0, 3, 1, 0], 
    [2, 0, 2, 5, 0, 1], 
    [0, 0, 2, 0, 5, 0], 
]) 
+1

产生['mcve'](https://stackoverflow.com/help/mcve)? – Divakar

+0

如果您有MovieLens100K数据集,则可以运行此代码。从这里下载files.grouplens.org/datasets/movielens/ml-100k.zip – partoftheorigin

+1

不需要。**您需要提供** [mcve] –

回答

6

我们可以输出使用np.random.choice(..., replace=False)来随机选择一些独特的非零平展索引,然后简单地索引和重置输入数组中的索引。

因此,一种解决方案将是 -

def make_more_sparsey(a, n): 
    # a is input array 
    # n is number of non-zero elements to be reset to zero 
    idx = np.flatnonzero(a) # for performance, use np.flatnonzero(a!=0) 
    np.put(a, np.random.choice(idx, n, replace=False),0) 
    return a 

样品运行 -

In [204]: R = np.array([ 
    ...:  [3, 0, 5, 3, 0, 1], 
    ...:  [0, 1, 2, 1, 5, 2], 
    ...:  [4, 3, 5, 3, 1, 4], 
    ...:  [2, 5, 2, 5, 3, 1], 
    ...:  [0, 1, 2, 1, 5, 2], 
    ...: ]) 

In [205]: make_more_sparsey(R, n=5) 
Out[205]: 
array([[3, 0, 5, 3, 0, 1], 
     [0, 1, 0, 0, 5, 2], 
     [4, 3, 5, 3, 1, 4], 
     [2, 5, 0, 5, 3, 1], 
     [0, 1, 0, 1, 0, 2]]) 
+0

这很好。 – sascha

+0

@partoftheorigin如果'R'是你的输入数组,那么就执行'np.put(R,np.random.choice(idx,n,replace = 0),0)'。不要这样做:'a = np.put(R ..)'。我假设'a'作为输入数组。最终的结果将是一个更加稀疏的'R'。 – Divakar

+0

谢谢Divakar! – partoftheorigin

0

使用np.ravelravel方法来创建平坦化。请注意,flatten方法总是创建一个副本,所以变异将不起作用。

a = np.array([ 
    [3, 0, 5, 3, 0, 1], 
    [0, 1, 2, 1, 5, 2], 
    [4, 3, 5, 3, 1, 4], 
    [2, 5, 2, 5, 3, 1], 
    [0, 1, 2, 1, 5, 2], 
]) 
r = a.ravel() 
r[random.randrange(0, len(r))] = 0