我能够在Python中执行此数据ETL工作。但是,因为我需要与R集成,而我是R的新手,所以我在这里发布问题。我想爆炸基于START_DATE日期和结束日期的日期,并做累积频率求和自变量“类型” 原始数据有3列与变量名日期,结束日期和导出虚拟变量类型 start_date, end_date, type
1/1/2016, 1/3/2016, A
1/2/2016, 1/2/2016, B
1
我有一个分类变量保持列表字符串,具有可变长度的数据帧的虚拟变量(这是很重要的,否则这个问题将是this重复或this),例如: df <- data.frame(x = 1:5)
df$y <- list("A", c("A", "B"), "C", c("B", "D", "C"), "E")
df
x y
1 1 A
2 2 A, B
3 3 C
4 4 B, D, C