我想改变第一个DStream成为第二个使用spark。但我不知道该怎么做?我已经尝试了groupByKey(),它没有工作,aggregateByKey()只使用RDD而不是DStream。如何使用相同的密钥组合一个DStream密钥和值对?
这是当前结果:
DStream [(1,value1),(2,value2),(3,value3),(1,value4),(1,value5),(2,value6)]
这是结果,我想:
DStream(1,(value1,value4,value5)) ,(2,(value2,value5)) ,(3,(value3))
感谢您的答复。
你是什么意思'groupByKey' _didn't work_? – zero323
使用与groupByKey相同的键在组合它们时不会给我相同的键和值对。这意味着它不会给我这个结果:DStream(1,(value1,value4,value5)),(2,(value2,value5)),(3,(value3))。我不知道如何做到这一点,也许我使用groupByKey错误? – peter