我有一个包含重复的独特患者ID(〜250,000)的数据集。我想统计每个唯一RID出现的平均次数。我只能找出如何使用计算的实际次数每一个独特的RID出现:计算重复变量的平均数
proc freq data=patients;
tables rid;
run;
IE:我不想知道
RID 1出现2
RID 2出现4
RID 3出现3
我想知道的是,平均数是唯一的RID出现为3
感谢您的帮助!
我有一个包含重复的独特患者ID(〜250,000)的数据集。我想统计每个唯一RID出现的平均次数。我只能找出如何使用计算的实际次数每一个独特的RID出现:计算重复变量的平均数
proc freq data=patients;
tables rid;
run;
IE:我不想知道
RID 1出现2
RID 2出现4
RID 3出现3
我想知道的是,平均数是唯一的RID出现为3
感谢您的帮助!
您可以通过PROC SQL实现这一
Select count(*)/count(distinct rid)
from patients;
数学表示记录总数除以唯一RID数量。
您可以将SQL与COUNT DISTINCT和COUNT一起使用来完成此操作。