我有这样的包含多列数据集:选择许多列和其他非连续列以查找重复?
ID Indicator Name C1 C2 C3....C90
A 0001 Black 0 1 1.....0
B 0001 Blue 1 0 0.....1
B 0002 Blue 1 0 0.....1
有些ID的是重复的,因为该指标是不同的,但他们本质上是相同的记录。为了找到重复的内容,我想选择不同的ID,Name,然后选择C1到C90来检查,因为具有相同Id和指标的一些索赔具有不同的C1 ... C90值。
有没有办法通过proc sql或sas数据步骤选择c1 ... c90?似乎我能想到的唯一方法是设置数据集,然后删除非必要列,但在实际数据集中,它不仅是指标,而且还包含至少15个其他列。
我从来不知道你可以选择使用宏的批量列,这是非常有益的! – PinkyL
太棒了!祝你好运PinkyL! – Hugs