设置的重复数据集在SAS数据步

假设我有一个SAS数据集，看起来像这样：设置的重复数据集在SAS数据步

我需要的是在（说）2次读取该数据集的新数据集，以指示一个新的变量，其“复制”是这样的：

重要的是，该数据以这样的准确顺序读 - 整个初始数据集被读出一次，然后再等

任何关于效率的想法在数据步骤中做到这一点的方法？（实际上，我的数据集很大，我需要多次阅读，而且我想避免排序。）

我试过了，但新数据集中的观察顺序并不是我想要的：

data foo; 
set tmp; rep=1; output; 
set tmp; rep=2; output; 
run;

来源

2011-07-11 itzy

如果你想保持数据的一步，那么这将工作，如你所述。

data foo; 
    set tmp (in=INA) tmp (in=INB); 
    if INA then REP=1; 
    if INB then REP=2; 
run;

来源

2011-07-11 15:18:09 richie

你可以尝试使用视图和PROC追加像这样：

/* create view for rep=2 */ 

data rep2/view=rep2; 
set tmp; 
rep = 2; 
run; 

/* create dataset for rep=1 */ 

data foo; 
set tmp; 
rep = 1; 
run; 

/* append rep=2 to rep=1 dataset */ 

proc append base=foo data=rep2; 
run;

来源

2011-07-11 05:12:06

data rep; 
    set tmp; 

    do rep = 1 to 2; /* or 3, or whatever */ 
    output; 
    end; 
proc sort; 
    by rep id; 
run;

就是这样。

来源

2011-07-11 10:26:42 Anton

谢谢，我试图避免排序。 – itzy

我想知道，为什么？您是否尝试保留原始记录订单（超出ID）或有一些性能考虑因素？ – Anton

这是一个巨大的文件，排序大约需要20分钟。我需要做这个数千次，所以你是对的，这是关于性能。 – itzy

设置的重复数据集在SAS数据步

回答

相关问题