pca

    2热度

    1回答

    我目前正在使用一个非常特定的数据集:它有大约1000列和1M行,但大约90%的值是Nan。 这不是因为记录不好,而是因为数据表示对个人进行的测量,只有大约100个特征与每个人相关。因此,输入缺失值会完全破坏数据中的信息。 要将具有相同特征的个体聚集在一起并且只考虑与每个子组相关的列并不容易,因为这实际上会为每组列填充极小的组(几乎填充列中的任何组合对于给定的个体是可能的)。 问题是,scikit学

    1热度

    1回答

    我正在尝试创建一个线性歧视分析(LDA)的双标。我使用从这里获得的代码的修改版本https://stats.stackexchange.com/questions/82497/can-the-scaling-values-in-a-linear-discriminant-analysis-lda-be-used-to-plot-e 但是,我有80个变量,使得双标点极难读取。由于它们的箭头长度很长,

    1热度

    1回答

    我只是一个新手R编码器,并且受到使用PCA和特征脸技术来分类图像的启发。然而,大多数例子似乎在Python中,我宁愿继续在R的发展。 我已经加载剑桥灰度人脸图像到一个400样本x 10304列ImageData,每列代表折叠出来的112x92灰度像素值。我可以使用pixmapRGB确定每个图像。 我进行PCA分析,并相信我已经提取了特征值,但是当我从50个EigenFaces重构我的第一幅图像时,

    0热度

    1回答

    我想在R代码在线PCA,这个代码没有现有的实现可用,因此,它可能对其他人有用。可以找到伪代码here(算法1)。我到目前为止已经完成如下: PCA<-function(X,k,epsilon){ X_f<-norm(as.matrix(X),"f") d<-nrow(X) n<-ncol(X) l<-floor((8*k)/(epsilon^2))

    3热度

    1回答

    在示例ggbiplot脚本图中有3组,我如何更改标记的颜色和形状? library(ggbiplot) data(wine) wine.pca <- prcomp(wine, scale. = TRUE) ggbiplot(wine.pca, obs.scale = 1, var.scale = 1, group=wine.class, varname.size = 3, lab

    0热度

    1回答

    我有一点阴谋窘境,我希望你们对我有一个快速和简单的答案。我使用prcomp()运行PCA,并首次尝试使用ggplot来绘制它。我成功地创造了一个美学上令人愉悦的身材,但是我刚刚有同事指出它目前没有色盲友好。 我已经使用的配色方案不能轻易改变(因为还有很多这个PCA图需要协调的其他数字),所以我一直在试图改变我的身材,为每个组包含不同的符号。 我发现另一个post提到使用scale_shape_ma

    1热度

    1回答

    我正在尝试PCA中包含NAs的较大数据集中的某些列。当我删除NAs时,它会导致项目数量不匹配,因此我无法将该数据集用于标签信息。我该如何解决? > ef <- sepData[c(4, 5, 6, 7, 8, 9, 10)] > autoplot(prcomp(na.omit(ef)), data = sepData, colour = 'species', label = TRUE, labe

    0热度

    2回答

    在生成一个包含20个观测值的模拟数据集之后,在三个类别(即60个观测总数)和50个变量中,我需要绘制前两个主要成分评分矢量,使用不同的颜色来表示三个独特的类别。 我相信我可以创建模拟数据集(请确认),但我有问题想出如何为类和图绘制颜色。我需要确保这三个类在图中分开显示(否则我需要重新运行模拟数据)。 #for the response variable y (60 values - 3 class

    1热度

    1回答

    我正在尝试为在线市场网站实施新的供应商排名系统。我想要做的是按照从最高到最低的综合分数对供应商进行排序。此刻,我想到的只是使用线性模型在计算分数的,有点像 score = w1 * f1 + w2 * f2 + w3 * f3.... 其中F1,F2,...是不同的功能(例如,平均评价得分,取消订单速率,响应率等)和w1,w2 ...是这些特征的相应权重。 我想为每个商品的0-100分供应商评

    0热度

    1回答

    希望今天有一个简单的问题: 我正在绘制RDA(在R Studio中)并想要移除第二个X和Y(顶部和右侧)轴。纯粹为了美学目的,但仍然。我使用的代码如下。我已经设法删除第一个轴(我会用更好的东西替换它们)xaxt =“n”和yaxt =“n”,但它仍然把其他人。 问题:如何我是否从R中的图中移除顶部和右侧的轴? 为了使这个例子具有可重现性,您将需要两个分别称为“bio”和“abio”的等长数据框。