2013-02-27 263 views
2

我试图订购一系列我存储在数据框中的时间数据。格式是:如何按R数据框中的年份和月份进行排序?

"%Y-%b" 

它看起来像"2009-Sep"

直到现在我还设法找到了这种方法:

ds[order(as.Date(ds$yearmonth, format="%Y-%b")),] 

但只按年份,然后将其移至以月份的字母顺序,给我的订单2009-Jan,2009-Jul,2009-Jun等。我很困惑,这不是一个容易解决的问题。

请帮助...

最佳 卡斯帕

+1

你看着as.Date的'输出( ds $ yearmonth,format =“%Y-%b”)'? – mnel 2013-02-27 03:22:20

+1

@mnel有你吗?这不是有效的日期。 :-) – 2013-02-27 03:23:47

+1

@GavinSimpson,我有。我正在帮助OP澄清他的问题。 :-)。 – mnel 2013-02-27 03:24:37

回答

7

在包中的as.yearmon()功能(和"yearmon"类)动物园是专为这类数据:

dat <- c("2009-Sep","2009-Feb","2009-Jan") 
require(zoo) 
d2 <- as.yearmon(dat, "%Y-%b") 
> sort(d2) 
[1] "Jan 2009" "Feb 2009" "Sep 2009" 
> order(d2) 
[1] 3 2 1 
> d2[order(d2)] 
[1] "Jan 2009" "Feb 2009" "Sep 2009" 

你当然可以在每个日期的每天paste0()并通过as.Date()强制到"Date"类,但as.yearmon()似乎更自然的对我说:

> as.Date(paste0(dat, "-01"), "%Y-%b-%d") 
[1] "2009-09-01" "2009-02-01" "2009-01-01" 

注意您可以通过强迫的"yearmon"对象"as.Date"类,如产生相同的结果:

> as.Date(d2) 
[1] "2009-09-01" "2009-02-01" "2009-01-01" 
+0

人们应该记住矢量类应该是“字符”。我的默认“因素”是“NA”值。 – 2013-02-27 10:46:05

+1

@KasperChristensen好点。这只是表明可重复实例的优点。从你的问题中不可能说出这些,所以我告诉你,数据是字符(这就是你展示的)。 'as.yearmon(as.character(dat),“%Y-%b”))'是解决因子问题的方法之一。另一种方法是通过指定变量类来开始以正确的格式读取数据。通过'read.table()'及其兄弟中的'colClasses' – 2013-02-27 14:46:08