pca

    1热度

    2回答

    我想对包含子特征的数据集进行一些特征提取(或聚类)。例如,数据集如下所示。目标是使用数据对机器人的类型进行分类。 Samples : 100 robot samples [Robot 1, Robot 2, ..., Robot 100] Classes : 2 types [Type A, Type B] Variables : 6 parts, and 3 sub-features for

    2热度

    1回答

    我使用ggord图形包绘制R Vegan绘制的PCA结果。 我想绘制PCA图形而不添加环境变量。在R素食主义者中,PCA可以被绘制成没有问题,但是在ggord中,相同的图形将不起作用。 ggord文档给出的示例包括用于在PCA图上绘制矢量的环境数据集的代码。我想在ggord中绘制出相同的结果,我可以在没有环境向量的情况下制作素食。 在严格的素食者的代码,使用样品数据集,其产生的排序图的我想: or

    0热度

    1回答

    我正在尝试使用scikit-learn在训练好的k-means模型中预测一群测试文档的集群。 vectorizer = TfidfVectorizer(stop_words='english') X = vectorizer.fit_transform(train_documents) k = 10 model = KMeans(n_clusters=k, init='k-means++',

    1热度

    1回答

    在得到分析结果后,我正在进行主成分分析,如何识别第一对主要预测指标?因为情节很混乱。很难看到预测结果的名称: PCA结果的哪个部分应该查看?这更像是如何确定可以解释的最重要的预测变量,让我们说80%的数据变化。我们知道,例如前5个部分是这样做的,而主要部分只是预测变量的组合。如何识别那些“重要”预测指标。

    0热度

    1回答

    如果我想将序列(特征)A,B和C投影到带有张量LSTM的目标序列,我怎么能知道每个特征对目标影响的重要性?主成分分析有帮助吗?如果pca可以帮助,该怎么办?数据的 的结构(列)设定如下面: A sequence B sequence C sequence Target sequence

    2热度

    1回答

    所以我一直在通过现有的问题来解决这个问题,但无济于事。 我有一个由个人(117)组成的数据集,每个个人都有来自不同变量(12)的观察结果,并且由具有8个级别的因子变量分组。 我想根据Anderson和Willis的方法对这些数据的主要坐标进行规范分析。我开始使用BiodiversityR :: CAPdiscrim。让我们先从一些示例数据: individual <- c(1:30) group

    1热度

    1回答

    我在Python中使用PCA来减少我拥有的数据的维数。目前的数据有768行和10列。 我使用下面的代码来实现PCA: import numpy as np from sklearn import decomposition demo_df = pd.read_csv('data.csv') pca = decomposition.PCA(n_components=4) comps =

    1热度

    1回答

    我想知道是否需要在R中对我的样本进行PCA转置数据。我正在使用内置函数prcomp()。我的数据集是RNA seq表达数据,列是样本,行是基因表达。它看起来有效,但是对行/列应该有什么共识?谢谢!

    2热度

    1回答

    我想对特定数据集执行主成分分析,然后将主成分馈送到LogisticRegression分类器。 具体而言,我想申请PCA并使用函数computePrincipalComponentsAndExplainedVariance来保持总方差的90%。 下面的代码读取数据集: // Load the data val text = sparkSession.sparkContext.textFile("

    2热度

    1回答

    我有一个具有特定列和行组的数据矩阵。 Promoters Exons Introns Intergenic UTR5 UTR3 EncodeDnase TFBS CpGislands CpGshores CpGshelf Enhancer Valley umrs canyons genebodies enhancer34 groups 44905 34778 49182 32420 21190