pca

    0热度

    2回答

    我正在使用sklearn的PCA模块。我正在使用下面的代码来设置分析。 from sklearn.decomposition import PCA pca = PCA(n_components=9) p = pca.fit([row[:-1] for row in norm]) norm这里是我的归一化数据集,并在最后一列的唯一标识符,这就是为什么我在最后一行删除它。这个数据集中有9个特征

    0热度

    1回答

    按照通常的方法,我创建了一个screeplot来评估有多少主分量轴是重要的。但是,破损的杆比PC3和PC4的变化大,但不是PC2。 只有PC1在破杆模式下显着或者PC3和PC4也显着? 感谢

    2热度

    2回答

    我有115 * 8000的数据,其中115是功能的数量。当我使用像这样的matlab pca功能 [coeff,score,latent,tsquared,explained,mu] = pca(data); 对我的数据。我有一些价值。我在here上阅读了如何减少我的数据,但有一件事让我感到困惑。 explained数据显示功能在计算上有多重,但功能是否在此过程中重新组织,或者功能与我给它的功

    1热度

    2回答

    我使用的是python package为多个分类变量多元对应分析的王子模块。我学习的一组地质数据,这里是一个示例预览: Quartz Oxides Hematite Limonite Geothite Clay Soil_Type 1 2 3 4 1 0 A 2 1 4 3 0 1 B 3 4 2 1 4 0

    0热度

    1回答

    我遵循this教程来创建和可视化PCA。 Im特别感兴趣的部分是为现有模型添加新的数据点。 正如本教程所示,我们将使用predict(ir.pca,newdata = tail(log.ir,2))来预测新的PC。但是,我如何将这些新观察添加到现有的情节?它看起来不像预测函数返回与ggplot函数中使用的ir.pca相同的对象。 我发现了类似的问题here和here但他们计算新的PCA评分并将它们

    2热度

    1回答

    我正在开发一个项目,我必须用Spark的MLlib进行K-means聚类。问题是我的数据有744个功能。我做了一些研究,发现PCA是我需要的。最好的部分是Spark PCA的实现,所以我决定这么做。 double[][] array=new double[381][744]; int contor=0; for (Vector vectorData : parsedTrai

    2热度

    1回答

    我正在尝试使用sklearn执行PCA的python实现。我创建了以下功能: def dimensionality_reduction(train_dataset_mod1, train_dataset_mod2, test_dataset_mod1, test_dataset_mod2): pca = PCA(n_components= 200) pca.fit(train

    0热度

    1回答

    我有一个相当大的数据集,我想分解,但太大,无法加载到内存中。研究我的选择,似乎sklearn's IncrementalPCA是一个不错的选择,但我无法弄清楚如何使它工作。 我可以在数据加载就好: f = h5py.File('my_big_data.h5') features = f['data'] 而且从this example,看来我需要决定我想从它读什么大小的块: num_rows

    1热度

    1回答

    我使用PCA从我的数据集here与工具生成的双标图S-加 运行我的数据的脚本是: a= princomp(x = ~ ., data = Week.2.Mon.portsweep,scores=T,cor =F) a$loadings a$scores biplot(a,scale=F) 的双标图结果 用我的知识,我解释双标图如下: 个 左&底轴:PC1 & PC2的成绩 右&顶轴:PC

    1热度

    1回答

    我想用plotly包建立一个3D PCA双情节,因为这个图形很好,并且以html格式(我需要的)交互。 我的困难是添加加载。我想加载从点(0,0,0)(即相当于二维双外壳) 点直线呈现所以总而言之,我不知道如何添加从3D图形中心开始的直线。 我已经使用PCA函数计算了分数和加载; pca1 <- PCA (dat1, graph = F) 为分数: ind1 <- pca1$ind$coord