2017-02-21 164 views

回答

1

在您的数据矩阵中,缺失的值可以是0,但不是为一个非常稀疏的矩阵存储一堆零,而是通常会存储一个COO矩阵,其中每行都以CSR格式存储。

如果您正在使用NMF的建议,那么你就可以通过查找W和H,使得W.H约等于X与所有三个矩阵都是非负的条件因子分解数据矩阵X。当你重建这个矩阵X时,一些缺失值(你将存储零点的地方)可能变成非零值,有些可能保持为零。此时,在重构的矩阵中,这些值就是您的预测值。

因此,要回答你的问题,是他们的0或丢失数据的NMF模型?一旦适合的NMF模型将包含您的预测值,所以我将它们计为零。这是一种预测数据中缺失值的方法。

+0

“算作零” - 你是什么意思?我认为@cech询问是否在损失函数中考虑了稀疏矩阵暗示的零条目(是试图重建0条目的$ WH $产品),还是损失函数忽略隐含的用于推断的零条目(即用户A没有对产品B进行评分,如果他这么做,他会评价什么......不是用户A对产品B评价为0) – Robert