dimension-reduction

0热度

1回答

比方说 y=2; z=4; [email protected](x,y,z) x.^2+y.^2+z.^2; 而且我想在[0,1]为X F和整合。好像我必须定义G和做四（G，0,1） [email protected](x) f(x,y,z); quad(g,0,1) 我的问题是，是否有可能做F上四的情况下直接定义一个新功能。

0热度

3回答

阅读R中的Columnwise Matrix

我已经花了很多时间尝试，但没什么效果 - 我猜这对于高级R用户来说很容易。我得到一个数据格式，其中每个元素线性发生。首先，标签作为字符串，然后1000个数字功能，所有splited与空白： "label1" 1 0 1 0 0 0 ... "label2" 0 0 0 0 1 0 ... "label2" 0 0 1 0 1 0 ... "label2" 1 1 1 1 0 0 ...

6热度

1回答

在自然语言处理（NLP）中，如何进行有效的降维？

在NLP中，特征的维度总是非常大。例如，对于一个项目而言，特征的维度接近2万（p = 20,000），并且每个特征是0-1整数，以显示特定单词或双重字形是否在纸张中呈现（一篇论文是R^{p} $）中的数据点$ x \。我知道这些特征之间的冗余是巨大的，所以降维是必要的。我有三个问题： 1）我有10万个数据点（n = 10,000），每个数据点有10万个特征（p = 10,000）。降低维度的有效

1热度

1回答

使用相关系数（Pearson）降维[Python]

我正在使用this答案，以便在矩阵（ndarray）中找到大于给定极限f的相关系数，其形状为（29421,11001 ）[即29,421行和11,001列]。我已经适应代码，如下所示（随机位选择两个列中的一个，以除去;此外，对应于该连接的答案的行具有后他们“###”）：问题：我得到的数千个相关系数大于1 ......从我的理解来看，这不应该发生？ rand = random() ro

4热度

3回答

减少尺寸

我试图将高维数据集减少到2-D。但是，我无法预先访问整个数据集。所以，我想生成一个函数，它需要一个N维向量并返回一个二维向量，这样，如果我给它在N维空间中靠近的向量，结果在二维空间。我以为SVD是我需要的答案，但我无法让它工作。为简单起见，设N = 3并假设我有15个数据点。如果我在15x3矩阵X中预先获得所有数据，则： [U, S, V] = svd(X); s = S; %s is a

1热度

1回答

正交匹配追踪

我在Python运行正交匹配追踪算法，并得到以下警告： RuntimeWarning：正交匹配追踪提前结束，由于在字典中的线性关系。要求的精度可能未达到要求。我该如何删除字典中的线性依赖关系？

2热度

1回答

为什么scikit-learn truncatedSVD默认使用“随机化”算法？

我使用truncatedSVD和40000大小的term-document matrix来缩小尺寸到3000维，当使用'随机'时，方差比约为0.5（n_iter = 10）使用'arpack'时，方差比约为0.9 “随机”算法的方差比低于“arpack”之一。那么为什么scikit-learn truncatedSVD使用'随机'算法作为默认值？