数组我有很多很多的文件JSON字符串线,他们有这样的:斯卡拉合并两个或更多个字符串作为一个JSON属性
{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":"A", "etc":"...", ...}
{ "id":124, "team":"B", "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}
我可以在Scala中加载它们的数据帧。
通过用ID分组,我想这样的:
{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":["A","B"], "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}
在Scala中,我该怎么办呢?
注:我不知道子属性有多少是在每个JSON。大多数属性在json行中都很常见。但是在几个json行中可能会有一些独特的属性。
做你想要做这Apache的火花? –
是的! Apache的火花。 – Daebarkee