0
我在python numpy的阵列,我想重复自己,所以我用 tile(array(x), (2, 1))
是否有相当于Spark中的python磁贴?
此,给出一个数组[1,2,3]
将返回[[1,2,3],[1,2,3]]
但pySpark我有一个pipelineRDD代替。 这是否有相应的功能? 我无法找到它。
谢谢
我在python numpy的阵列,我想重复自己,所以我用 tile(array(x), (2, 1))
是否有相当于Spark中的python磁贴?
此,给出一个数组[1,2,3]
将返回[[1,2,3],[1,2,3]]
但pySpark我有一个pipelineRDD代替。 这是否有相应的功能? 我无法找到它。
谢谢
有没有相同的:
可以使用重复RDD在一个维度:
sc.union([rdd for _ in range(n))
这相当于
np.tile(a, n)
其中n是一个标量。