我有这个数据框与来往或离开国家的人的记录。 'date'和'inout'表示一个人在某个日期是在国内旅行('I')还是在外('O')旅行。 id = 1在2008-10-06出国旅行,2009-04-30再次出发。R:如何从时间戳创建连续的日期间隔
数据:
df <- data.frame(id=c(1,1,2,2,2,2,3),
date=c('2008-10-06','2009-04-30', '1999-07-25','2004-02-27','2005-06-09','2013-07-01','2010-09-07'),
inout = c('O','I','I','O','I','O','I'))
id date inout
1 1 2008-10-06 O
2 1 2009-04-30 I
3 2 1999-07-25 I
4 2 2004-02-27 O
5 2 2005-06-09 I
6 2 2013-07-01 O
7 3 2010-09-07 I
我需要这样一个新的数据帧:
id start end destination
1 1 1900-01-01 2008-10-06 home
2 1 2008-10-06 2009-04-30 abroad
3 1 2009-04-30 2017-08-01 home
4 2 1900-01-01 1999-07-25 abroad
5 2 1999-07-25 2004-02-27 home
6 2 2004-02-27 2005-06-09 abroad
7 2 2005-06-09 2013-07-01 home
8 2 2013-07-01 2017-08-01 abroad
9 3 1900-01-01 2010-09-07 abroad
10 3 2010-09-07 2017-08-01 home
如果每个人的第一次入住了默认日期1900-01-01开始和最后的住宿结束当前日期(2017-08-01)。 在这个数据框中,Id = 1从1900-01-01到2008-10-06在国内,从2008-10-06到2009-04-30在国外,从2009-04-30到2017-08 -01。
任何人都可以帮助我。如果需要,最好使用dplyr软件包。 致以问候
由于同一'id'有不同的行程,我们可以假设每个行程的开始和结束日期总是出现在连续的行中吗? –
@Oriol,是的。数据总是与df格式相同。 Michael –