2013-10-04 60 views
0

我知道类似的问题之前已经被问过,但是我还没有找到正确的答案。这似乎是我错过的简单解决方案。R中的多个随机选择

我有一个大约20,000位参与者的样本,并希望从此样本中随机选择2500个接收礼品卡,另外还有另一个2500(不在第一个组中)接收现金补贴。参与者不得以任何方式重复/重复。参与者通过唯一ID进行标识。

我为代表参与者的每行创建索引(我相信这一步可以避免)。

Npool=1:dim(pool_20K)[[1]] 
giftcards=sample(Npool,2500) 

- 如何创建现金补贴组,以便他们是唯一的参与者,并且不包括为礼品卡选择的组?

后,我将结合指标与数据

giftcards_ids=pool_20K[giftcards, ] 

任何见解?我觉得我正在复杂化一个相当简单的问题。

感谢先进!

回答

1

洗牌整个事情,然后选择子集:

shuffled.indices = sample(nrow(pool_20K)) 

giftcards = shuffled.indices[1:2500] 
cash = shuffled.indices[2501:5000] 
+0

这工作完全!谢谢 :) – Tan