dimension-reduction

    0热度

    1回答

    比方说 y=2; z=4; [email protected](x,y,z) x.^2+y.^2+z.^2; 而且我想在[0,1]为X F和整合。 好像我必须定义G和做四(G,0,1) [email protected](x) f(x,y,z); quad(g,0,1) 我的问题是,是否有可能做F上四的情况下直接定义一个新功能。

    0热度

    3回答

    我已经花了很多时间尝试,但没什么效果 - 我猜这对于高级R用户来说很容易。 我得到一个数据格式,其中每个元素线性发生。首先,标签作为字符串,然后1000个数字功能,所有splited与空白: "label1" 1 0 1 0 0 0 ... "label2" 0 0 0 0 1 0 ... "label2" 0 0 1 0 1 0 ... "label2" 1 1 1 1 0 0 ...

    6热度

    1回答

    在NLP中,特征的维度总是非常大。例如,对于一个项目而言,特征的维度接近2万(p = 20,000),并且每个特征是0-1整数,以显示特定单词或双重字形是否在纸张中呈现(一篇论文是R^{p} $)中的数据点$ x \。 我知道这些特征之间的冗余是巨大的,所以降维是必要的。我有三个问题: 1)我有10万个数据点(n = 10,000),每个数据点有10万个特征(p = 10,000)。降低维度的有效

    1热度

    1回答

    我正在使用this答案,以便在矩阵(ndarray)中找到大于给定极限f的相关系数,其形状为(29421,11001 )[即29,421行和11,001列]。 我已经适应代码,如下所示(随机位选择两个列中的一个,以除去;此外,对应于该连接的答案的行具有后他们“###”): 问题:我得到的数千个相关系数大于1 ......从我的理解来看,这不应该发生? rand = random() ro

    4热度

    3回答

    我试图将高维数据集减少到2-D。但是,我无法预先访问整个数据集。所以,我想生成一个函数,它需要一个N维向量并返回一个二维向量,这样,如果我给它在N维空间中靠近的向量,结果在二维空间。 我以为SVD是我需要的答案,但我无法让它工作。 为简单起见,设N = 3并假设我有15个数据点。如果我在15x3矩阵X中预先获得所有数据,则: [U, S, V] = svd(X); s = S; %s is a

    1热度

    1回答

    我在Python运行正交匹配追踪算法,并得到以下警告: RuntimeWarning:正交匹配追踪提前结束,由于在字典中的线性关系。要求的精度可能未达到要求。 我该如何删除字典中的线性依赖关系?

    2热度

    1回答

    我使用truncatedSVD和40000大小的term-document matrix来缩小尺寸到3000维, 当使用'随机'时,方差比约为0.5(n_iter = 10) 使用'arpack'时,方差比约为0.9 “随机”算法的方差比低于“arpack”之一。 那么为什么scikit-learn truncatedSVD使用'随机'算法作为默认值?