1
我有具有以下结构的平面文件:火花1.3.1将数据映射到键 - 值[]对在Java中
key1|"value-001"
key2|"value-002"
key2|"value-003"
key3|"value-004"
key2|"value-005"
key1|"value-006"
key3|"value-007"
我需要映射该数据文件到键 - 值对,其中值将是一键值的列表,如:
key1:["value-001","value-006"]
key2:["value-002","value-003","value-005"]
key3:["value-004","value-007"]
我需要从Java代码执行此操作。正如我从Spark编程指南中了解的那样,此操作应该由sc.flatMapValues(..)
,sc.flatMap(..)
或sc.groupByKey(..)
执行,但我不知道哪一个。我该怎么做呢?
谢谢!工作很好! – Yustas
很高兴听到它:)你可以把它标记为“已回答”吗? –
np,如果能找到这个选项:) – Yustas