我有一个有两列的数据框,其中一个(称为dist)是密集向量。我如何将它转换回整数数组列。将数据帧中的矢量列转换回数组列
+---+-----+
| id| dist|
+---+-----+
|1.0|[2.0]|
|2.0|[4.0]|
|3.0|[6.0]|
|4.0|[8.0]|
+---+-----+
我尝试使用以下UDF的几个变种,但它返回一个类型不匹配错误
val toInt4 = udf[Int, Vector]({ (a) => (a)})
val result = df.withColumn("dist", toDf4(df("dist"))).select("dist")
什么是“标准”栏? –
一个数组例如 – ulrich
所以,你显然想要在一个矢量中合并所有列,对吗? –