2011-04-11 47 views
11

我在R中与日期和时间斗争,但我希望这是一个相当基本的任务。R中的分档日期

这里是我的数据集:

> str(temp.df) 
'data.frame': 74602 obs. of 2 variables: 
$ time : POSIXct, format: "2011-04-09 03:53:20" "2011-04-09 03:53:15" "2011-04-09 03:53:07" "2011-04-09 03:52:39" ... 
$ value: num 1 1 1 1 1 1 1 1 1 1 ... 

> head(temp.df$time, n=10) 
[1] "2011-04-09 03:53:20 EDT" "2011-04-09 03:53:15 EDT" "2011-04-09 03:53:07 EDT" "2011-04-09 03:52:39 EDT" 
[5] "2011-04-09 03:52:29 EDT" "2011-04-09 03:51:56 EDT" "2011-04-09 03:51:54 EDT" "2011-04-09 03:51:46 EDT" 
[9] "2011-04-09 03:51:44 EDT" "2011-04-09 03:51:26 EDT" 

为了方便...

> dput(head(temp.df$time, n=10)) 
structure(c(1302335600, 1302335595, 1302335587, 1302335559, 1302335549, 
1302335516, 1302335514, 1302335506, 1302335504, 1302335486), class = c("POSIXct", 
"POSIXt"), tzone = "") 

我所希望做的:

  • 我怎么能找到多少时间是最小和最大日期/时间之间?
  • 使用1小时时间段创建我的数据摘要的最佳方式是什么?

你能提供将大大任何帮助表示赞赏

+1

看包动物园(优秀)小插曲 - 它在那里。 – 2011-04-11 16:05:49

+1

就我个人而言,我发现通常避免时间有时比试图将其转换为R友好格式更容易。我将日期分成列,并使用原始数字,而不是日,月,年,小时,分钟,秒。 – 2011-04-12 05:42:09

回答

6

使用适当的时间序列包zoo和/或xts。这个例子是直接从的aggregate.zoo()帮助页面,其聚合POSIXct秒数据每10分钟

tt <- seq(10, 2000, 10) 
x <- zoo(tt, structure(tt, class = c("POSIXt", "POSIXct"))) 
aggregate(x, time(x) - as.numeric(time(x)) %% 600, mean) 

xtsto.period()功能也是一个肯定的赢家。在SO和r-sig财务名单上有无数的例子。

+0

你能否澄清你的MOD 600在做什么?水桶是每小时,这是我用变量x看到的。聚合线似乎对我的数据所做的所有工作是在每个桶的开始和结束处添加47秒。这是什么意思? – Frikster 2015-07-27 17:36:55

+0

查看评论:'#聚合POSIXct秒数据每10分钟' – 2015-07-27 17:38:06

+0

削减(时间(x),休息=“10分钟”)是一个很好的方式来简化聚合函数的第二个参数。在zoo软件包的聚合函数的文档下有这样做的例子。 https://cran.r-project.org/web/packages/zoo/zoo.pdf – JHowIX 2016-01-15 21:19:42