您创建一个数据帧后,读一卡桑德拉DB和获取列表在destinationip字段中,您可以像这样查询
val spark =
SparkSession.builder().master("local").appName("test").getOrCreate()
import spark.implicits._
val data = spark.sparkContext.parallelize(Seq(
(123, Array("10.100.1.25", "10.100.164.36"), "10.100.164.32"),
(456, Array("10.100.1.25", "10.100.164.3"), "10.100.164.32"),
(45, Array("10.100.1.25", "10.100.164.36"), "10.100.164.32"),
(46, Array("10.100.1.25", "10.100.164.367"), "10.100.164.32")
)).toDF("current_time","destinationips", "source_ip")
data.select("*").where(array_contains(data("destinationips"), "10.100.164.36")).show
有什么哟你试过了吗?您的预期输出也与您分享的数据不一致。 – mtoto
您只对'destinationips'感兴趣吗? –