2017-03-24 64 views
-1

我试图加载数据集到R和改变列的类型为日期时间。把字符串到日期时间

strptimeas.POSIXctas.Date对于不同的情况应该可以工作;

这是我的代码:

a <- structure(list(DATE = c("01/01/2011 12:00:00", "01/02/2011 12:00:00", 
    "01/03/2011 12:00:00", "01/04/2011 12:00:00", "01/05/2011 12:00:00", 
    "01/06/2011 12:00:00"), VAL = c(65.34447917, 65.23983333, 65.03183333, 
    64.89107292, 64.83333333, 64.848625), id = c("VT1-1", "VT1-1", "VT1-1", 
    "VT1-1", "VT1-1", "VT1-1")), .Names = c("DATE", "VAL", "id"), row.names = c(NA, -6L), 
    class = c("tbl_df", "tbl", "data.frame")) 

b1 <- as.POSIXct(a$DATE, format = "%m/%d/%y %H:%M:%S") 
b2 <- strptime(a$DATE,"%m/%d/%Y %H:%M/%S") 

但他们只是返回NA。这很可能是一个错字;但在处理不同的日期时间格式时如何避免这种情况?

+0

你有一个错字 - 你用' “%M /%d /%Y%H:%M /%S”',并在最后一个斜杠。你需要用冒号“%m /%d /%y%H:%M:%S”。但看到我的答案。 –

回答

2
R> library(anytime) 
R> anytime(a$DATE) 
[1] "2011-01-01 12:00:00 CST" "2011-01-02 12:00:00 CST" "2011-01-03 12:00:00 CST" 
[4] "2011-01-04 12:00:00 CST" "2011-01-05 12:00:00 CST" "2011-01-06 12:00:00 CST" 
R> 

的随时随地包的建立是为了使这个简单的 - 你不必提供你可能会得到错误的格式,它只是尝试了一些似是而非的人的。对于“合理”的投入,它只是工作

+0

恐怕它不起作用,除非你认为dmy标准是不合理的。它适用于美国的mdy标准,但恐怕dmy是第二常用的(在ymd之后)。它对ymd没有问题。它像6/9/2018这样的单个数字也失败了,它需要尾随零。我认为提供格式比依靠启发式更安全 – Slav

+0

问题是,除非作者将它分类,否则不能区分mm-dd-yyyy和dd-mm-yyyy,并且这确实使得它不合理,因为它是错误的,俯卧。因此,对ISO日期的偏好:yyyy-mm-dd。而且文件很清楚。 –

+0

所以 - 换句话说,你需要提供一个格式,即使你可能弄错了,而不是你说了什么。否则,它很容易出错。与基础解决方案没有多大区别,只有一个包装更少 – Slav