2016-01-07 30 views
1

我想从一组病例中选择其中一个变量的值为1的病例。只从总体子集中选择随机病例似乎是可能的,而不是一种病症。SPSS在变量上有条件时选择随机病例

这是我的数据集的一个简单的例子:

case 1. value 0 
case 2. value 1 
case 3. value 0 
case 4. value 1 
case 5. value 1 
case 6. value 1 
case 7. value 0 

所以,我想借鉴那些对变量类别中的值为1的情况下随机例(50%)。这将使情况1,3和7脱离随机选择。

一个选项是将这些值为1的情况转移到另一个数据库,然后选择随机情况。但是,我想保留数据库中的所有情况。

有谁知道这是否可能在SPSS?

+0

改进的格式 –

回答

0

而是谈论您如何做到这一点,如果你一步通过下面的例子中,应该提供足够的信息,如何做到这一点的:

DATA LIST FREE/X1 TO X3 D1. 
BEGIN DATA 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 1 
4 5 6 1 
7 8 9 0 
1 2 3 1 
4 5 6 1 
7 8 9 0 
END DATA. 
DATASET NAME DS1. 
AGGREGATE OUTFILE=* MODE=ADDVARIABLES /BREAK=D1 /CountN=N. 
COMPUTE Rand=RV.UNIFORM(0,1). 
RANK Rand BY D1. 
COMPUTE FILTER=D1=1 and RRand<=(CountN/2). 
SORT CASES BY D1 Rand. 
0

为什么不直接使用一个简单的计算像 计算保留=值EQ 1和rv.uniform(0,1)GE .5。 FILTER BY保持。 (如果保留数据集中的所有案例,但仅使用过程中的保留案例)或 SELECT IF。删除未选定的案例。

+0

我想到了这个最初只是然后意识到你可能不会随机产生选择50%的案例。 –

+0

该公式将对所选病例的50%进行随机变化。如果它需要恰好50%,则需要采取其他措施。 – JKP