1
我有阵元组[INT]的RDD,想知道有多少元素数组中的类似相似元素的数量,是什么是做到这一点的最佳方式?查找(数组[INT],数组[INT])的RDD
我有阵元组[INT]的RDD,想知道有多少元素数组中的类似相似元素的数量,是什么是做到这一点的最佳方式?查找(数组[INT],数组[INT])的RDD
阵共有单元号是一个大小交集的:
rdd.map { case (x, y) => x.toSet.intersect(y.toSet).size }
你说的“类似”是什么意思? –