2017-08-25 59 views
1

我正在进行时间序列分析,我希望能够用不同的分析单位开发多个数据集。即:数据集1中的单位将是X国的区域,为期4年(districtYearPeriodCode)中的2周时间段,数据集2中的单位将是X国的区域,为期4周的时间段4年,等等。查找出现日期的时间间隔

我已经创建了许多数据框,其中包含每个间隔的开始和结束日期以及间隔ID。以下是两周的时间间隔。

begin <- seq(ymd('2004-01-01'),ymd('2004-06-30'), by = as.difftime(weeks(2))) 
end <- seq(ymd('2004-01-14'),ymd('2004-06-30'), by = as.difftime(weeks(2))) 
interval <- seq(1,13,1) 
df2 <- data.frame(begin, end, interval) 

     begin  end interval 
1 2004-01-01 2004-01-14  1 
2 2004-01-15 2004-01-28  2 
3 2004-01-29 2004-02-11  3 
4 2004-02-12 2004-02-25  4 
5 2004-02-26 2004-03-10  5 
6 2004-03-11 2004-03-24  6 
7 2004-03-25 2004-04-07  7 
8 2004-04-08 2004-04-21  8 
9 2004-04-22 2004-05-05  9 
10 2004-05-06 2004-05-19  10 
11 2004-05-20 2004-06-02  11 
12 2004-06-03 2004-06-16  12 
13 2004-06-17 2004-06-30  13 

除此之外,我有一个数据框,其中包含对事件的观察,包括日期。它看起来是这样的:

new.df3 <- data.frame(dates5, districts5) 
new.df3 

    dates5 districts5 
1 2004-01-01   d1 
2 2004-01-02   d2 
3 2004-01-03   d3 
4 2004-01-04   d4 
5 2004-01-05   d5 

是否有一个功能我可以写或命令,我可以使用像这样的东西就结了?

 dates5 districts5 interval5 
1 2004-01-01   d1   1 
2 2004-01-02   d2   1 
3 2004-01-03   d3   1 
4 2004-01-04   d4   1 
5 2004-01-05   d5   1 

我一直在试图寻找在lubridate包,或在其他线程的答案,但所有的答案似乎在特定的时间间隔内找出一个日期是否下降,而不是确定的时间间隔进行调整一个日期来自一组间隔。

很多appreiciated!

+0

喜欢的东西:https://stackoverflow.com/questions/41132081/find-which-interval-row-in-a-data-frame-that-each-element-of- a-vector-belong-in/41133991也许? – thelatemail

+0

是的,它的工作! – srojascabal

回答

0

我使用了@alistair在here概述的purrr。我复制它下面:

elements %>% 
    map(~intervals$phase[.x >= intervals$start & .x <= intervals$end]) %>% 
    # Clean up a bit. Shorter, but less readable: map_chr(~.x[1] %||% NA) 
    map_chr(~ifelse(length(.x) == 0, NA, .x)) 
## [1] "a" "a" "a" NA "b" "b" "c"