-1
我从一个CSV文件中读取,我想从整个CSV只有特定的领域我的命令如下:订购的火花(斯卡拉)
val readfile = sc.textFile("path").map(m=>m.split(",").filterNot(._startsWith("NA")))
val required_fields = readfile.map(x=>(x(0),x(1),x(2),x(8),x(15),x(16),x(17)))
现在我想改变从15列的类型要加倍的字符串。所以,我这样做,
val myDouble = required_fields.map(x=>(x._1,x._2,x._3,x._8,x._15.toDouble,x._16,x._17))
现在我需要15栏只取前10个值,所以我用takeOrdered funtion
myDouble.takeOrdered(10)(Ordering[Double].on(x=>(-x._5)))
但是当我运行的最后一个命令我得到ArrayIndexOutOfBound异常17
请帮我一把。 谢谢。
你能分享一些样本数据吗? – BDR