2015-02-11 182 views
0

我有一个年度患者索赔的数据集,每个病人每年可以有多个索赔(即:一个女性可以有两个索赔声称如果她一年生两次)。在不删除的情况下统计变量中的重复观察值* SAS *

我想统计每个患者ID重复的次数,但我不想消除重复或将其从数据集中取出。有没有不同的代码来做到这一点?

谢谢!

+0

能描述一下你想要的结果?有很多方法可以做到这一点。你只是想要一个带有频率的报告,或者你想添加一个变量来计数患者ID的发生次数吗?另外,你可以发布你尝试过的任何代码吗? – DWal 2015-02-11 04:35:50

回答

0
data work.claims_data; 
input patient_id $ claim_number $; 
datalines; 
P1 C1 
P1 C2 
P1 C3 
; 
run; 

proc sql; 
select patient_id,count(distinct claim_number) - 1 as cnt 
from claims_data 
group by patient_id 
having cnt > 0; 
quit; 

工作:上面的SQL过程将为患者明智地计算来自输入数据集的不同索赔编号。如果我们从每个计数中减去1,则会给出每个患者的重复索赔计数。

输出:

Patient_ID cnt 
     P1  2 
+0

具有变量名称cnt的Count-1可能会误导未来的用户。 – Reeza 2015-02-11 14:38:13

相关问题