outliers

    -1热度

    2回答

    我会尽力解释我的疑问。 例如,我有一个表格,其中包含一些变量X,Y,Z。 每个变量都有数字值。 所以,让我们说我有 RDIST RDENS AGR BLF 1 146 0.000 0 0.0 2 338 0.000 0 0.0 3 931 0.000 0 3.7 我试图找出异常值,所以我用dotchart。 但是现在,我想知道,在每个变量中,在哪个观察中我有异常值。 使用list(

    -1热度

    1回答

    想,我在我的手下面的数据集(google drive link), 最左边一栏代表类型/类别的卡(梅花,黑桃,方块,红心)。其余的列是特征(Hu Moments)。 4.00000000e+000 1.81685834e-001 9.69817396e-006 1.38999809e-003 4.53935830e-006 -3.00925971e-010 -1.02459512e-008 -1.

    1热度

    2回答

    我正在尝试使用kmeans进行分析。 我有一个数据集: > head(data) tstamp elementid value hours 2016-09-15 15:20:28 IN_TEMP 25.12237 15 2016-09-15 15:20:29 IN_TEMP 25.44952 15 2016-09-15 15:20:29 IN_TEMP 25.5355

    0热度

    1回答

    我想编写一个程序来从我的数据集中删除异常值。这段代码显示了异常的行数和列数,但它不会从我的数据集将其删除: library(outliers) out <- outlier(Practice_data[,2:4], logical=TRUE) out <- cbind(FALSE, out) Practice_data[which(out[,], TRUE)] which(out[,],

    0热度

    1回答

    我可以通过ELKI运行变化的k来运行LOF,以便比较哪个k最好? 通常你选择一个k,然后你可以看到例如ROCAUC。我想为数据集取出最好的k,所以我需要比较多个运行。我能做到这一点比手动更改k的值并执行运行更容易吗?我想举个例子比较所有k = [1-100]。 感谢

    1热度

    1回答

    我试图在我的数据框中检测异常值,并用NA替换异常值。 我稍微修改了这里提供的功能:How to repeat the Grubbs test and flag the outliers。当尝试一个向量的函数时效果很好,但是我的问题是当我在数据框上使用它时。该函数检测异常值,但我不知道如何将结果作为数据帧。 我想要的结果是我的原始数据框由NA s取代。 NA将被检测到的异常值。 这是我曾尝试到现在为

    0热度

    1回答

    我几乎所有来自R程序包的函数都有问题:离群值。 的 “choosen一个” 功能,正常工作是异常值 list_ = ['chisq.out.test','cochran.test', 'dixon.test', 'grubbs.test', 'outlier', 'qcochran'] y = some data without brackets like 0.0, 0.0, 0.0

    0热度

    1回答

    我有一些极端异常值将我的回归模型抛出,并使用If-Then-Else语句将它们删除。然而,SAS完全消除了这些数据点,并在剩余的数据点中找到了新的异常值。有没有办法从分析中删除异常值,而不会在混合中投入更多? 我计算Q3 + 1.5 * IQR,并使用该值作为如此: Data lungcancer; input trt surv age sex @@; /* create a new varia

    1热度

    1回答

    对于处理这样的数据来说相当新颖;我有两条曲线,我不知道如何处理,但我知道我希望得到什么结果。两个数据集的原始图如下所示(左);下面(右)显示了我想我对他们的粗略配合,叠加配合为红色。 第一个示例: 幅度的突然下降是数据采集过程中的一个假象。这意味着它本质上是不可预测的,并且我理想地希望找到一种对此行为有效的方法。 在第一种情况下,我可以尝试通过使用阈值以消除幅度的急剧下降,但不会帮助我在第二种情况

    2热度

    1回答

    当执行进口 from sklearn.ensemble import IsolationForest 得到错误 Traceback (most recent call last): File "<ipython-input-13-90a3d865c881>", line 1, in <module> from sklearn.ensemble import IsolationForest