pca

    0热度

    1回答

    我已经使用'FactoMineR'包中的'PCA'函数来获取主成分分数。我已经尝试阅读此论坛上的软件包详细信息和类似问题,但无法弄清代码以修改用于表示变量因子映射上的补充变量的箭头的行类型。默认情况下,这些都是蓝虚线和我拼命无法找到如何让他们连续 我不管理ggplot真的想知道如果有这种情节的解决方案: plot(res, choix="var") 有人知道提示吗? 例如,这里是一个代码: l

    0热度

    1回答

    需要有关如何创建一个数据集的密集矩阵一些指点.. 说我的数据集的数据行1 csv文件:1.1,1.0,1.2和第2行:1.4,1.1,1.3 如何将数据集转换为矩阵..因此可以应用矩阵运算。 Java/Spark 谢谢!

    -1热度

    1回答

    我正试图在python中执行降维。我有文字和他们的频率计数。我想通过对其进行维度降低来减少文本的数量。例如,如果我有一个文本文件和他们的频率如何减少在Python中的项目数量?

    0热度

    1回答

    我知道这是PCA的常见错误,但我经历了所提供的解决方案并且未能正常工作。 我跟着: Error in svd(x, nu = 0) : 0 extent dimensions 下面是我的代码提取物: require(class) set.seed(2095) # dataset source:https://kdd.ics.uci.edu/databases/kddcup99/kddcup99

    1热度

    1回答

    我有movielens dataset,我想将PCA应用于它,但sklearn PCA函数似乎不能正确执行它。 我有718 * 8913矩阵的行表示用户和列表示电影 这里是我的Python代码: 加载影片的名字和电影分级 movies = pd.read_csv('movies.csv') ratings = pd.read_csv('ratings.csv') ratings.drop(['

    0热度

    1回答

    想象一下,我有9维和6000样本的训练数据,并且我使用sklearn PCA应用了PCA算法。 我将它的尺寸减小到4,并且知道我希望将具有9个特征的一个新样本尽可能快地转换为具有4个组件的训练数据空间。 这是我第一次PCA代码: X_std = StandardScaler().fit_transform(df1) pca = PCA(n_components = 4) result = pc

    0热度

    1回答

    我正在测量跨PCA空间和'特征空间'的〜20种治疗和3组的质心。如果我正确理解我的数学老师,他们之间的距离应该是相同的。然而,按照我计算的方式,他们不是,我想知道如果我做数学的方式,他们中的任何一个都是错误的。 我使用的是臭名昭著的葡萄酒的数据集作为说明我的方法/ MWE: library(ggbiplot) data(wine) treatments <- 1:2 #treatments t

    1热度

    1回答

    以下两个函数有什么区别? prepTransform.m function [mu trmx] = prepTransform(tvec, comp_count) % Computes transformation matrix to PCA space % tvec - training set (one row represents one sample) % comp_count -

    0热度

    2回答

    我正尝试使用网格搜索在拟合到线性回归之前选择数据主成分的数量。我很困惑我怎样才能制作一个我想要的主要组件的字典。我把我的列表放入param_grid参数中的字典格式,但我认为我做错了。到目前为止,我已经收到了关于包含infs或NaN的数组的警告。 我下面从流水线的线性回归PCA说明:http://scikit-learn.org/stable/auto_examples/plot_digits_p

    2热度

    1回答

    我阅读了有关使用RPCA查找时间序列数据上的异常值的信息。我对RPCA的基本原理和理论有所了解。我有一个做RPCA的Python库,几乎有两个矩阵作为输出(L和S),输入数据和稀疏矩阵的低秩近似值。 输入数据:(行是一个白天和10层的特征为列。) DAY 1 - 100,300,345,126,289,387,278,433,189,153 DAY 2 - 300,647,245,426,889