2013-04-16 46 views

回答

0

我假设你的数据包含一些与你感兴趣的数据点数量非常不同的离群值,这些就是你所说的“噪声”。请记住这个假设,我会:

a)从我的数据中完全删除它们,注意为什么(这可能需要一些调查)。

b)添加一个名为solent的变量,如“异常值”,并给出异常值为1,其他值为0.然后,可以根据此变量对分析进行分层或过滤数据。同样,你需要注意为什么你认为那些你被标记为离群值而不是主要数据点的一部分。