如何将文本文件保存为火花中的orc

我是新来的火花，我试图将文本文件保存到使用spark-shell的orc是他们的任何方式来做到这一点？如何将文本文件保存为火花中的orc

vall data =sc.textFile("/yyy/yyy/yyy") 
data.saveAsOrcFile("/yyy/yyy/yyy")

来源

2017-07-10 sande

您可以将RDD转换为DataFrame然后保存。

data.toDF().write.format("orc").save("/path/to/save/file")

读回，用sqlContext

import org.apache.spark.sql._ 
val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) 

val data = sqlContext.read.format("orc").load("/path/to/file/*")

来源

2017-07-10 20:28:30

如何将文本文件保存为火花中的orc

回答

相关问题