2016-08-12 87 views
-3

我尝试删除潜在的异常值R. 我的问题来删除一个庞大的数据库的潜在异常是下一个: https://www.photobox.co.uk/my/photo/full?photo_id=9286177980尝试使用R.

当我申请的箱线图,我newdata得到了更多潜在的异常值比原始数据。林与500.000观测工作,所以我需要解决这个正确地做到我的分析。

我知道,当分布是不均匀的,像这样的情况下,我们可以用第二个和第三个四分位数的工作,但如果我这样做,我失去我的数据的20-30%。

谢谢。

+4

链接被重定向到主站点。 (https://www.photobox.co.uk/a/) – zx8754

回答

1

删除异常坚实的办法是放弃这比平均值+ 2或(在你的情况下,如果你不想删除的条目太多)放大所有条目3点标准差(即> M + 3SD) 。