我已经流数据来降低如下星火由
id, date, value
i1, 12-01-2016, 10
i2, 12-02-2016, 20
i1, 12-01-2016, 30
i2, 12-05-2016, 40
想通过ID,以减少度日日期总值信息像RDD需要
输出对于给定的ID和列表(天365) 我必须把值的基础上一年的一天是2016年12月1日列表中的位置是336,因为有与同一日期设备I1两个实例,他们应该聚集
id, List [0|1|2|3|... |336| 337| |340| |365]
i1, |10+30| - this goes to 336 position
i2, 20 40 -- this goes to 337 and 340 position
请指导减少或转换组来做到这一点。
这是Spark Streaming还是Structured Streaming?你试过什么了?问题在哪里? –
问题是动态列表更新和如何减少如果我通过编号减少所有的值将汇总不管一年中的哪一天 –
你已经有什么代码?这是Spark Streaming吗? –