0
我想要评估两个变量之间的相关性,但我的原始数据有很多背景噪声,我需要摆脱。特别是,我只想保留显示正斜率的部分数据。我如何摆脱其他一切?如何仅子集显示正斜率的数据
我想要评估两个变量之间的相关性,但我的原始数据有很多背景噪声,我需要摆脱。特别是,我只想保留显示正斜率的部分数据。我如何摆脱其他一切?如何仅子集显示正斜率的数据
我假设你的数据包含一些与你感兴趣的数据点数量非常不同的离群值,这些就是你所说的“噪声”。请记住这个假设,我会:
a)从我的数据中完全删除它们,注意为什么(这可能需要一些调查)。
b)添加一个名为solent的变量,如“异常值”,并给出异常值为1,其他值为0.然后,可以根据此变量对分析进行分层或过滤数据。同样,你需要注意为什么你认为那些你被标记为离群值而不是主要数据点的一部分。