2015-11-21 31 views
0

我有一个大型的温度数据集(csv),我必须按日期(年)进行子集化,以便每十年创建5个较小的数据集。因此,从1960-1969年的数据将是一个较小的csv文件,1970-1979年的数据将是另一个csv文件等。我一直试图使用for循环执行此操作R使用for循环从一个大型csv文件中创建较小的csv文件

所以如下所示:

IDs<-unique(df$ID) 
for (i in 1:length(IDs)){ 
    temp <- df[df$ID==IDs[i],] 
    #more things to do with temp 
} 

但我不确定如何去做这件事。 for循环应该创建新的csv文件,这些文件是按照现有大型数据集中的日期进行子集化的。

+2

请提供[可重现的示例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 –

+1

对于大型数据集,可以看一下'data.table'包,对于快速读取,可以使用'fread()'函数。 – jogo

+1

您可以使用'cut'来创建分组变量,然后用该组分割数据集。 – akrun

回答