在不删除的情况下统计变量中的重复观察值* SAS *

我有一个年度患者索赔的数据集，每个病人每年可以有多个索赔（即：一个女性可以有两个索赔声称如果她一年生两次）。在不删除的情况下统计变量中的重复观察值* SAS *

我想统计每个患者ID重复的次数，但我不想消除重复或将其从数据集中取出。有没有不同的代码来做到这一点？

谢谢！

2015-02-11 lrk889

能描述一下你想要的结果？有很多方法可以做到这一点。你只是想要一个带有频率的报告，或者你想添加一个变量来计数患者ID的发生次数吗？另外，你可以发布你尝试过的任何代码吗？ – DWal 2015-02-11 04:35:50

data work.claims_data; 
input patient_id $ claim_number $; 
datalines; 
P1 C1 
P1 C2 
P1 C3 
; 
run; 

proc sql; 
select patient_id,count(distinct claim_number) - 1 as cnt 
from claims_data 
group by patient_id 
having cnt > 0; 
quit;

工作：上面的SQL过程将为患者明智地计算来自输入数据集的不同索赔编号。如果我们从每个计数中减去1，则会给出每个患者的重复索赔计数。

输出：

Patient_ID cnt 
     P1  2

来源

2015-02-11 06:42:00

具有变量名称cnt的Count-1可能会误导未来的用户。 – Reeza 2015-02-11 14:38:13

在不删除的情况下统计变量中的重复观察值* SAS *

回答

相关问题