我有一个要求,使Hive中的数据仓库和使用HBase服务实时访问 所以我想知道什么是相同的架构 我可以首先转储数据在HBase和访问它作为Rest服务并在Hive中创建外部表,并在其上运行配置单元查询? 威尔蜂巢分布即我需要我的集群中的所有节点上安装蜂巢否则这将是中央Hive中的数据仓库
回答
在回答你的问题:
蜂巢将分发。
为了获得最佳性能,我会考虑在群集的每个节点上安装Hive。 Hive将HiveQL转换为MapReduce作业 - 作业将在数据所在的位置执行。如果这是不可能的,数据将不得不转移到工作中。为了响应时间,您需要在每个节点上配置Hive。
要创建引用存储在HBase中的数据的Hive表,可以查看Hive - HBase Integration wiki。这里有一个简单的例子:
CREATE TABLE hbase_table_1(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")
TBLPROPERTIES ("hbase.table.name" = "xyz");
感谢Jeremiah为您提供的输入信息 –
因此,我可以使用HBase进行近实时查询吗?并进行数据转换hive查询将在HBase表上运行 –
你明白了!只要您以易于使用HBase读取的方式构建数据,您应该可以使用HBase进行实时访问,并使用Hive进行批量处理和转换。请记住,Hive只是'INSERT' /'DELETE' - 没有更新。 –
- 1. Sqoop导入到/ user/hive /仓库中的hive数据库中
- 2. 设置Hadoop数据仓库环境(Hive)
- 3. Hive未能在仓库中显示表
- 4. Hadoop&Hive作为仓库:每日数据交付
- 5. 免费数据仓库 - Infobright,Hadoop/Hive还是什么?
- 6. Hadoop Hive数据库
- 7. SQL数据仓库
- 8. 数据仓库 - OLTP
- 9. Pyspark:远程Hive仓库位置
- 10. Hive:即使当表是外部时,源数据也被移动到hive数据仓库
- 11. 如何将数据库A的Hive表中的数据加载到数据库B的Hive表中?
- 12. 数据仓库中的重叠记录
- 13. 数据仓库中的索引
- 14. 数据仓库中的分段步骤?
- 15. 数据仓库中的代理键
- 16. 数据仓库中的时间差异
- 17. 处理数据仓库中的空值
- 18. SQL Server 2008中的数据仓库
- 19. azure中SQL数据仓库的价格
- 20. 数据仓库中的列存储
- 21. Webfocus数据仓库中的报告
- 22. 基于Hive的数据仓库任务 - 添加序列号到记录
- 23. 使用Hive作为数据仓库时对我的情况有什么好处?
- 24. Azure数据仓库中的用户主数据库
- 25. 数据库/数据仓库中的多重冲突事实
- 26. Spring数据库JPA在两个数据库仓库中使用
- 27. 数据仓库 - OLAP操作
- 28. 创建数据仓库
- 29. Cassandra用于数据仓库
- 30. 什么是数据仓库?
请告诉我们你到目前为止做了些什么。 –