0
我有一个大型的温度数据集(csv),我必须按日期(年)进行子集化,以便每十年创建5个较小的数据集。因此,从1960-1969年的数据将是一个较小的csv文件,1970-1979年的数据将是另一个csv文件等。我一直试图使用for循环执行此操作R使用for循环从一个大型csv文件中创建较小的csv文件
所以如下所示:
IDs<-unique(df$ID)
for (i in 1:length(IDs)){
temp <- df[df$ID==IDs[i],]
#more things to do with temp
}
但我不确定如何去做这件事。 for循环应该创建新的csv文件,这些文件是按照现有大型数据集中的日期进行子集化的。
请提供[可重现的示例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 –
对于大型数据集,可以看一下'data.table'包,对于快速读取,可以使用'fread()'函数。 – jogo
您可以使用'cut'来创建分组变量,然后用该组分割数据集。 – akrun