2014-12-08 33 views
4

我有一个“iplRDD”,它是一个json,我通过hivecontext执行以下步骤和查询。我得到的结果,但没有列标题。有没有办法让列名与值一起?有没有办法使用hiveContext获取列名?

val teamRDD = hiveContext.jsonRDD(iplRDD) 
teamRDD.registerTempTable("teams") 
hiveContext.cacheTable("teams") 

val result = hiveContext.sql("select * from teams where team_name = "KKR") 
result.collect.foreach(println) 

有什么想法吗?

回答

2

teamRDD.schema.fieldNames应该包含标题名称。

1

你可以用头保存您的数据框 '结果' 这样以csv文件:。

result.write()格式( “com.databricks.spark.csv”)选项( “头”, “真”)保存(outputPath);

1

您可以通过使用得到它:

result.schema().fields(); 
相关问题