2
在cassandra中,我有一个列表列类型。我是新来的火花和斯卡拉,并不知道从哪里开始。 在火花我想得到每个值的数量,是否有可能这样做。 下面是数据帧spark中列表值的计数 - 数据帧
+--------------------+------------+
| id| data|
+--------------------+------------+
|53e5c3b0-8c83-11e...| [b, c]|
|508c1160-8c83-11e...| [a, b]|
|4d16c0c0-8c83-11e...| [a, b, c]|
|5774dde0-8c83-11e...|[a, b, c, d]|
+--------------------+------------+
我想输出
+--------------------+------------+
| value | count |
+--------------------+------------+
|a | 3 |
|b | 4 |
|c | 3 |
|d | 1 |
+--------------------+------------+
火花版本:1.4
你可以请检查编辑 –