0
我有一个年度患者索赔的数据集,每个病人每年可以有多个索赔(即:一个女性可以有两个索赔声称如果她一年生两次)。在不删除的情况下统计变量中的重复观察值* SAS *
我想统计每个患者ID重复的次数,但我不想消除重复或将其从数据集中取出。有没有不同的代码来做到这一点?
谢谢!
我有一个年度患者索赔的数据集,每个病人每年可以有多个索赔(即:一个女性可以有两个索赔声称如果她一年生两次)。在不删除的情况下统计变量中的重复观察值* SAS *
我想统计每个患者ID重复的次数,但我不想消除重复或将其从数据集中取出。有没有不同的代码来做到这一点?
谢谢!
data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;
proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;
工作:上面的SQL过程将为患者明智地计算来自输入数据集的不同索赔编号。如果我们从每个计数中减去1,则会给出每个患者的重复索赔计数。
输出:
Patient_ID cnt
P1 2
具有变量名称cnt的Count-1可能会误导未来的用户。 – Reeza 2015-02-11 14:38:13
能描述一下你想要的结果?有很多方法可以做到这一点。你只是想要一个带有频率的报告,或者你想添加一个变量来计数患者ID的发生次数吗?另外,你可以发布你尝试过的任何代码吗? – DWal 2015-02-11 04:35:50