3

我在大型数据集上使用了维度降低方法(此处讨论:Random projection algorithm pseudo code)。降低数据集的维度后,我得到负面特征值

降维从1000到50后,我让我的新的数据集,其中每个样品的样子:

[1751 -360。 -2069。 ...,2694. -3295。 -1764。]

现在我有点困惑,因为我不知道负面特征值应该是什么意思。有没有像这样的负面特征可以吗?由于减少之前,每个样品是这样的:

3,18,18,18,126 ...

是正常还是我做错了什么?

回答

3

我想你实现了从this paper算法。

由于投影矩阵有一些否定条目,投影映射到负值是可以的。所以标志的变化并不表示错误。

+2

由于@Ahmed也提示我也对此问题发表评论 - 您的旧向量是降维空间的新基向量的一些线性组合。你的向量有时只能用一个新的维度表示,但是可以减去另一个维度。 扩展“特征”解释有点困难。但是,你的旧数据集中的一个项目是女王乐队,她拥有摇滚和歌剧元素。说新基础的一个方面是“摇滚”,另一个方面可能意味着“不像歌剧”。女王将是一些“摇滚”减去一些“不喜欢歌剧”。 –

+0

谢谢,现在有道理:) – Ahmed