这个答案避免subset
,处理缺少的观察和使用as.POSIXct
日期/时间格式。尽管如此,其余的代码与Tyler Rinker的答案几乎相同。请注意,我必须指定内部as.POSIXct
日期/时间变量的名称,而不是使用未格式化的变量Date_Time
的名称。
my.data <- read.csv(text = '
Date_Time, state, city
10/05/2011 07:32:40, AK, aa
15/06/2011 13:26:02, AK, bb
19/07/2011 13:26:02, OH, cc
NA, OH, dd
20/05/2012 14:57:27, PA, ee
22/07/2012 14:57:27, AL, ff
20/03/2013 15:03:18, NY, gg
', header=TRUE, stringsAsFactors = FALSE, na.strings = 'NA', strip.white = TRUE)
my.data$my_Date_Time <- as.POSIXct(my.data$Date_Time, format = "%d/%m/%Y %H:%M:%S")
# Select May
my.data[format.Date(my.data$my_Date_Time, "%m")=="05" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 1 10/05/2011 07:32:40 AK aa 2011-05-10 07:32:40
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
# Select 2012
my.data[format.Date(my.data$my_Date_Time, "%Y")=="2012" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
# 6 22/07/2012 14:57:27 AL ff 2012-07-22 14:57:27
# Select May 2012
my.data[format.Date(my.data$my_Date_Time, "%m")=="05" &
format.Date(my.data$my_Date_Time, "%Y")=="2012" &
!is.na(my.data$my_Date_Time),]
# Date_Time state city my_Date_Time
# 5 20/05/2012 14:57:27 PA ee 2012-05-20 14:57:27
经过多次尝试,我的代码工作使用,2011年11月:子集(销售,format.Date(日期,“%m”)==“11”&format.Date(日期,“%d”)==“11”)。我认为问题在于我用来创建数据框的read.csv命令,但这是一个不同的问题。我可以认为我最初的问题是令人满意的。 – 2012-02-23 14:52:54