2014-08-28 20 views
1

我有一个大的SAS数据集,我想随机分配观察到不同的测试和对照组。观察为SAS数据集随机分配观察到测试或对照

20%的人有被控制 5%将是Test1的 75%将Test2的

Basicaly,

obs 
1 
2 
3 
4 
5 

将成为

obs cell 
1 control 
2 test2 
3 test2 
4 test1 
5 test2 

我会怎么做那?

谢谢

回答

1

PROC SURVEYSELECT是这样做的基本方法。但是,Surveyselect不允许一次选择3组。

您可以在数据步骤中执行此操作,也可以使用SURVEYSELECT两次;一次挑选第一组(20%),然后从未选中选择第二组(75%/ 80%,93.75%),然后仍然未选中组3。

在datastep中,这不是非常糟糕难;您可以只分配一个随机值,按随机值对数据进行排序,然后将第一个5%的记录作为1,将(全部)记录的下一个20%记录为2,并将最后的75%记录为3;或者可以对第三组使用k/n取样进行一些修改。

相关问题