我有一个RDD[String]
其中包含以下数据:Scala的RDD [字符串]到RDD [字符串,字符串]
数据格式:('Movie Name','Actress Name')
('Night of the Demons (2009) (uncredited)', '"Steff", Stefanie Oxmann Mcgaha')
('The Bad Lieutenant: Port of Call - New Orleans (2009) (uncredited)', '"Steff", Stefanie Oxmann Mcgaha')
('"Please Like Me" (2013) {All You Can Eat (#1.4)}', '$haniqua')
('"Please Like Me" (2013) {French Toast (#1.2)}', '$haniqua')
('"Please Like Me" (2013) {Horrible Sandwiches (#1.6)}', '$haniqua')
欲将此转换为RDD[String,String]
如第一元件' '
将是我在RDD中的第一个字符串,' '
中的第二个元素将成为我在RDD中的第二个字符串。
我尝试这样做:
val rdd1 = sc.textFile("/home/user1/Documents/TestingScala/actress"
val splitRdd = rdd1.map(line => line.split(","))
splitRdd.foreach(println)
,但它给我一个错误:
[Ljava.lang.String;@7741fb9
[Ljava.lang.String;@225f63a5
[Ljava.lang.String;@63640bc4
[Ljava.lang.String;@1354c1de
这不是一个错误消息,这是一堆字符串的object-id。 – Malvolio
@Malvolio你能告诉我如何删除该错误 – user225508
从'split'的结果调用'toList'。 – Reactormonk