2012-03-30 45 views
2

我比较录得5年(2007- 2011年),其中的测量,在每年数为每小时数据测量如下:包括闰年比较时间序列

2007 = 8760 measurements; 
2008 = 8784 measurements; <-- leap year 
2009 = 8760 measurements; 
2010 = 8760 measurements; 
2011 = 8760 measurements; 

什么是最好的方法比较每个时间序列?对于非闰年的2月29日增加24个测量值(nans)是否更好?或者,将数据内插到相同的时间框架(其中时间以年的十进制日给出)是否更有效?

+0

你试图做什么比较?数据集不对应,所以你可能不会像like一样进行比较。 – walkytalky 2012-03-30 09:55:26

回答

2

完全取决于您所测量的数据类型。如果它是像天气数据那样的自然世界的东西,那么你可能更关心的是将冬至和春分配到春分。如果是金融市场数据,则可能需要排列日历,并可能完全排除闰日。

在没有更多背景的情况下很难提供更具体的建议。

+0

这些数据表示水温。因此,我看着温度如何从一年到另一年不同,并且可能找到相关性,数据需要与此相同。 – Emma 2012-03-30 10:14:50

+2

如果您匹配季节性标记,例如冬至和春分,数据将匹配。比赛完全不符合日历年。 – 2012-03-30 10:16:20