outliers

    -1热度

    2回答

    我已经在matlab中生成了一个数据集,然后在数据中嵌入了一些异常值。我想绘制它,因为我是新的matlab中,我不知道如何从不同的符号或不同的颜色从内部指定异常值。相对于x轴,y轴以及它们两者的偏离点。这是matlab的代码; pd = makedist('Normal'); rng(38) a = random(pd,100,1); b = datasample(1:100,40,'Rep

    0热度

    1回答

    我强加了“方块图”作为方法和1.5作为因素。 节点描述告诉: “子集 选择对测量结果进行分组的列(例如:板,批次,运行...)” 什么功能“组测量”?使用Mean + IQR *(1.5)和Mean - IQR *(1.5)独立测量其他列的异常值是否不是?

    1热度

    1回答

    我正在从Michael Faraway的线性模型(其中R(第11章,第160页))开始PCA部分的工作。 PCA分析对异常值敏感,Mahalanobis距离有助于我们识别它们。 作者通过绘制马哈拉诺比斯距离和卡方分布的分位数来检查异常值。 if require(faraway)==F install.packages("faraway"); require(faraway) data(fat,

    0热度

    1回答

    我正在寻找一个宏或SAS中的某些东西,可以帮助我隔离数据集中的异常值。我将异常值定义为:上限:Q3 + 1.5(IQR)下限:Q1-1.5(IQR)。我有以下SAS代码: title 'Fall 2015'; proc univariate data = fall2015 freq; var enrollment_count; histogram enrollment_count/vscal

    2热度

    1回答

    我有一个数据集,它包含一个帧的某个对象的像素值。我的代码可以在大多数时间准确地检测到对象;但是,有负面影响。我绘制了前600个值(x轴:帧号,y轴:对象的像素位置)。在第一张图片中,您可以看到原始数据;在第二张图片中,您可以看到正确的路径。 我已经尝试过使用不同参数进行平均值和中值滤波,但我无法获得任何有用的信息。是否有任何方法/算法用正确值替换异常值?

    0热度

    1回答

    我想知道是否有方法来计算异常值在直方图的情节。我想绘制一个随机变量的频率,这个随机变量非常小,分布在零附近。然而,在我考虑的大多数情况下,我也有一个让事情复杂化的异常点。有没有办法在R/Matlab中调整x轴的缩放比例,以便我可以捕获我正在考虑的随机变量的分布,并显示异常值?因为获得绘图的正常方法导致所有值都被认为是零,我想要显示它们是如何分布在零附近的。因此,理想情况下,我希望将零附近的比例表示

    0热度

    1回答

    关于数据科学的另一个常见问题! 假设我有一堆样本,并且必须检测每个样本的异常值。我的数据是单变量的,所以我可以使用简单的方法,如标准偏差或中位数绝对偏差。 现在我的问题是:怎么会做任何形式的验证,以查看结果是否一致,尤其是如果由于数据的大小而不是一个选项来看待它们?例如,选择用多少标准差来定义异常值。到目前为止,我还没有看到任何定量方法。它甚至存在吗? 干杯

    1热度

    1回答

    是否ELKI对于其中有许多重复值的数据失败?我有超过200万观测值(1D)的文件,但它只包含几百个独特值。其余的都是重复的。当我在ELKI中运行此文件时,对于LOF或LoOP计算,它将返回NAN作为任何k的异常值得分,小于频率最高的值的出现次数。我可以想象如果重复被认为是最近的邻居,LRD计算必须引起这个问题。但不应该这样做?我们可以依靠ELKI为这种情况生产的结果吗?

    6热度

    2回答

    你们是否有一个想法如何处理在血压曲线发现文物/异常的问题?我的目标是编写一个程序,找出每个人工制品的开始和结束。这里有不同文物的一些例子中,绿地面积是正确的血压曲线,红色的是人工制品,也需要检测: 这是一个整体的血压曲线的例子: 我的第一个想法是计算意思是从整条曲线和许多曲线的短时间间隔中找出它们的不同之处。但血压变化很大,我认为这不会奏效,因为它会发现太多不存在的“人造物”。 感谢您的输入! 编

    3热度

    1回答

    我想绘制使用ggplot()的直方图,但是我无法处理极端值。我希望他们能够在一个垃圾箱内(例如,称为“500以上”)联合起来。 我已经尝试了scale_x_continuous(breaks = seq(0,500, by = 50))函数,但它只是从x轴上删除标签(附后)如何处理这个问题的任何想法?