2013-03-21 42 views
0

我有一个完整的臭氧数据集,其中包含一些缺失值。我想用SPSS进行单一插补来计算我的数据。为了评估插补方法的准确性,我希望随机模拟缺失的数据模式,其中5%,10%,15%,25%和40%的数据缺失。缺失数据和单个插补

有人可以教我如何使用SPSS做随机缺失的数据模式吗?

此外,有人可以告诉我如何获得性能指标,如:平均绝对误差,测定系数和均方根误差,以检查估计缺失值的最佳方法。

回答

0

不幸的是,我目前的SPSS支持不缺数据分析,所以我只能给一些一般性的建议。

首先:对于缺失的数据模式:只需转到数据 - >选择案例 - >随机样本并删除所需数量的案例,然后运行插补。

如果您使用插补模块,则您提到的值应由spss提供。有一本说明书: ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/de/client/Manuals/IBM_SPSS_Missing_Values.pdf

+0

感谢您的帮助和链接。那么你是否知道如何获得性能指标来测试适合度? – user2193634 2013-03-21 08:34:11

+0

没有对不起 - 我没有使用这个模块2年,将不得不看到实际输出.. – 2013-03-21 08:41:43

0

第一个问题的答案。假设你的研究变量是y,并且你想模拟变量y的缺失。这是根据您缺少的数据模式计算额外变量y_miss的示例代码。

do if uniform(1) < .05. 
comp y_miss = $SYSMIS. 
else. 
comp y_miss = y. 
end if. 
+0

然后如何性能指标? – user2193634 2013-03-22 10:02:08

+0

你有配方如何计算指标? – djhurio 2013-03-22 11:21:37