我是新来Spark
我试图访问Hive
表Spark
如何访问蜂巢表火花
1)创建星火语境
val hc=new HiveContext(sc)
val hivetable= hc.sql("Select * from test_db.Table")
我的问题是,我得到了表到星火。
1)为什么我们需要注册表?
2)我们可以直接执行SQL operations
仍然为什么我们需要Dataframe
功能 像Join, Select, Filter
...等?
是什么让SQL Query`和数据帧Operations之间的两种操作差异
3)什么是星火优化?它是如何工作的?