2015-02-24 128 views
1

我有一个包含重复的独特患者ID(〜250,000)的数据集。我想统计每个唯一RID出现的平均次数。我只能找出如何使用计算的实际次数每一个独特的RID出现:计算重复变量的平均数

proc freq data=patients; 
tables rid; 
run; 

IE:我不想知道
RID 1出现2
RID 2出现4
RID 3出现3

我想知道的是,平均数是唯一的RID出现为3

感谢您的帮助!

回答

0

您可以通过PROC SQL实现这一

Select count(*)/count(distinct rid) 
from patients; 
1

数学表示记录总数除以唯一RID数量。

您可以将SQL与COUNT DISTINCT和COUNT一起使用来完成此操作。