pca

-1热度

1回答

我有一个数据集： https://docs.google.com/spreadsheets/d/1ZgyRQ2uTw-MjjkJgWCIiZ1vpnxKmF3o15a5awndttgo/edit?usp=sharing ，我试图运用主成分分析和基于在这个岗位提供图形来实现图形： https://stats.stackexchange.com/questions/61215/how-to-inter

0热度

1回答

从PCA获取集群r

我有一个显示两个真正大集群的PCA，我不知道如何确定每个集群中的哪些样本。如果有帮助，进出口使用prcomp生成PCA： pca1 <- autoplot(prcomp(df), label = TRUE, label.size = 2) 我的方法是尝试集群中使用K均值的PCA输出，2组获得集群： pca <- prcomp(df, scale.=TRUE) clust <- kmeans

0热度

1回答

需要使用numpy或sklearn对python中的数据集合进行主成分分析

我有一个'数据集合' df，数据如下。我正在尝试使用sklearn对数据集合进行主成分分析（PCA）。但我越来越Typeerror from sklearn.decomposition import PCA df # dataframe collection pca = PCA(n_components=5) pca.fit(X) 如何将数据帧集合转换为数组矩阵与序列。我想，如果我转换成

0热度

1回答

如何将ZCA应用于内存有限的大型图像数据集？

是谷歌告诉我的是：对于keras的ImageDataGenerator功能似乎已经可以开箱即用的zca_whitening。但是如果设置了该选项，则需要在整个数据集X上调用ImageDataGenerator.fit。所以这不是一个选项。对于sklearn，IncrementalPCA似乎与一个巨大的数据集一起工作，但我不知道如何将PCA旋转到ZCA的发生器风格。感谢您的帮助！

0热度

1回答

主成分分析 - 为什么特征向量的点积不是零？

我尝试使用Python sklearn对breast_canser数据集进行主成分分析。并且不明白为什么特征向量的点积（3个分量）不是零？ frst = pca.components_[0,:] scnd = pca.components_[1,:] thrd = pca.components_[2,:] orth1 = np.dot(frst,scnd) orth2 = np.dot(

0热度

1回答

PCA和K-means for word clustering

我有维基百科文章的语料库。我找出了10,000个最常用的单词，找到了它们的Word2Vec向量，并且在这些向量上使用了球形k-均值，根据意义上的相似性将这些单词聚类为500个组。我挑出了3个单词集并将单词转换回单词向量。每个单词向量都是一个300个数值的数组，所以我将它们全部应用PCA（从sklearn）将它们转换为2D。然后我绘制：每个点代表一个字，每种颜色代表1簇。问题是，这些群集不应该重

4热度

1回答

内存有效集中稀疏SVD/PCA（在Julia中）？

我有一个300万×900万的稀疏矩阵，有几十亿个非零条目。 R和Python不允许超过MAXINT非零条目的稀疏矩阵，因此我发现自己使用了Julia。虽然用标准偏差缩放这些数据是微不足道的，但贬低当然是一种天真的方式，因为这会创建一个密集的200+太字节矩阵。做SVD相关的代码朱莉娅可以在https://github.com/JuliaLang/julia/blob/343b7f56fcc84

0热度

1回答

向PCA模型添加一个点

我使用PCA将文档减少到2点，以便可以将它们可视化。我的方法看起来像这样。 pipeline = Pipeline([('tfidf', TfidfVectorizer())]) X = pipeline.fit_transform(sent_list).todense() pca = PCA(n_components = 2).fit(X) data2D

0热度

1回答

你可以合并两个主要组件吗？

我正在对5大人格特征进行回归，以及出生顺序如何影响这些特质。首先，我试图根据捕获这些特征的调查构建5个变量。我曾想过为类别（特质）中的每个问题创建假人，然后取平均值，但其中一些问题高度相关，因此重量将错误。我做了一个主成分分析，它给了我一个特征值超过一个的四个分量。问题是，他们都没有超过40 pct。方差。有什么方法可以将四个合并为一个变量？它是因变量，所以只能有一个。否则你是否有另外一个关

0热度

1回答

主成分

的标准偏差是否有可能是，一个或一些特征从所获得的主成分的标准偏差比任何的特征更多。例如，如果我的特点的标准偏差为FEAT1，FEAT2，feat3，feat4，feat5，feat6是0.019，0.027，0.026，0.025,0.026,0.030,0.019。我掌握的标准差主成分为： PC1，PC2，PC3，PC4，PC5，PC6作为0.05，0.020,0.018，0.016,0.0