pca

    -1热度

    1回答

    我有一个数据集: https://docs.google.com/spreadsheets/d/1ZgyRQ2uTw-MjjkJgWCIiZ1vpnxKmF3o15a5awndttgo/edit?usp=sharing ,我试图运用主成分分析和基于在这个岗位提供图形来实现图形: https://stats.stackexchange.com/questions/61215/how-to-inter

    0热度

    1回答

    我有一个显示两个真正大集群的PCA,我不知道如何确定每个集群中的哪些样本。 如果有帮助,进出口使用prcomp生成PCA: pca1 <- autoplot(prcomp(df), label = TRUE, label.size = 2) 我的方法是尝试集群中使用K均值的PCA输出,2组获得集群: pca <- prcomp(df, scale.=TRUE) clust <- kmeans

    0热度

    1回答

    我有一个'数据集合' df,数据如下。我正在尝试使用sklearn对数据集合进行主成分分析(PCA)。但我越来越Typeerror from sklearn.decomposition import PCA df # dataframe collection pca = PCA(n_components=5) pca.fit(X) 如何将数据帧集合转换为数组矩阵与序列。我想,如果我转换成

    0热度

    1回答

    是谷歌告诉我的是: 对于keras的ImageDataGenerator功能似乎已经可以开箱即用的zca_whitening。但是如果设置了该选项,则需要在整个数据集X上调用ImageDataGenerator.fit。所以这不是一个选项。 对于sklearn,IncrementalPCA似乎与一个巨大的数据集一起工作,但我不知道如何将PCA旋转到ZCA的发生器风格。 感谢您的帮助!

    0热度

    1回答

    我尝试使用Python sklearn对breast_canser数据集进行主成分分析。 并且不明白为什么特征向量的点积(3个分量)不是零? frst = pca.components_[0,:] scnd = pca.components_[1,:] thrd = pca.components_[2,:] orth1 = np.dot(frst,scnd) orth2 = np.dot(

    0热度

    1回答

    我有维基百科文章的语料库。我找出了10,000个最常用的单词,找到了它们的Word2Vec向量,并且在这些向量上使用了球形k-均值,根据意义上的相似性将这些单词聚类为500个组。 我挑出了3个单词集并将单词转换回单词向量。每个单词向量都是一个300个数值的数组,所以我将它们全部应用PCA(从sklearn)将它们转换为2D。然后我绘制: 每个点代表一个字,每种颜色代表1簇。问题是,这些群集不应该重

    4热度

    1回答

    我有一个300万×900万的稀疏矩阵,有几十亿个非零条目。 R和Python不允许超过MAXINT非零条目的稀疏矩阵,因此我发现自己使用了Julia。 虽然用标准偏差缩放这些数据是微不足道的,但贬低当然是一种天真的方式,因为这会创建一个密集的200+太字节矩阵。 做SVD相关的代码朱莉娅可以在https://github.com/JuliaLang/julia/blob/343b7f56fcc84

    0热度

    1回答

    我使用PCA将文档减少到2点,以便可以将它们可视化。 我的方法看起来像这样。 pipeline = Pipeline([('tfidf', TfidfVectorizer())]) X = pipeline.fit_transform(sent_list).todense() pca = PCA(n_components = 2).fit(X) data2D

    0热度

    1回答

    我正在对5大人格特征进行回归,以及出生顺序如何影响这些特质。首先,我试图根据捕获这些特征的调查构建5个变量。我曾想过为类别(特质)中的每个问题创建假人,然后取平均值,但其中一些问题高度相关,因此重量将错误。 我做了一个主成分分析,它给了我一个特征值超过一个的四个分量。问题是,他们都没有超过40 pct。方差。 有什么方法可以将四个合并为一个变量?它是因变量,所以只能有一个。 否则你是否有另外一个关

    0热度

    1回答

    的标准偏差是否有可能是,一个或一些特征从所获得的主成分的标准偏差比任何的特征更多。 例如, 如果我的特点的标准偏差为FEAT1,FEAT2,feat3,feat4,feat5,feat6是0.019,0.027,0.026,0.025,0.026,0.030,0.019。我掌握的标准差主成分为: PC1,PC2,PC3,PC4,PC5,PC6作为0.05,0.020,0.018,0.016,0.0