3
A
回答
0
索引是新的且正在发展(功能正在添加),但目前索引仅限于单个表并且无法使用与外部表创建索引创建一个单独的表可以对索引进行分区(匹配基表的分区)索引用于加快表中数据的搜索速度
分区提供数据分离hdfs级别,为每个分区创建子目录。分区允许在查询中读取的文件数量和数据量受到限制。但是,出现这种情况时,必须在您的WHERE中指定分区列条款。
在构建数据模型时,您可以根据数据大小和预期使用模式来确定索引和/或分区的最佳用法。
2
Sonia以下是本书可能对您有用的部分。 “Hive的索引功能有限,在通常的关系数据库意义上没有键,但是你可以在列上建立一个索引来加速某些操作,表的索引数据被存储在另一个表中 此外,该功能是相对较新,所以它没有很多选择,但是,索引过程可以通过插件Java代码进行定制,所以团队可以扩展功能以满足他们的需求。当逻辑分区实际上太多而且很少有用时,对其进行分区索引可以帮助修剪表中的某些块作为MapReduce作业的输入不是所有的查询都可以从索引中获益 - EXPLAIN语法和Hive可以用于确定给定查询是否由索引帮助 Hive中的索引与关系数据库中的索引类似,需要进行评估carefull y。 维护一个索引需要额外的磁盘空间,构建一个索引需要一定的处理成本。用户必须权衡这些成本与他们在查询表格时所提供的好处。“ 编程Hive手册Page 117
相关问题
- 1. 配置单元中的分区和分区有什么区别?
- 2. 查找和索引之间的区别
- 3. db2中的分配和分区之间的区别
- 4. 成对索引和单列索引之间的区别?
- 5. 配置单元分区和分区
- 6. 索引和元搜索和lucene支持之间的区别
- 7. Apache Tajo和Apache配置单元之间的实际区别
- 8. C++/OpenCV - Flann索引匹配和Flann匹配之间的区别
- 9. Elasticsearch中的索引和索引之间是否有区别?
- 10. 退出和退出配置单元之间有什么区别
- 11. 配置单元 - 静态分区 - 直接创建分区目录与使用alter table语句之间的区别
- 12. DynamoDB本地索引和全局索引之间的区别
- 13. 表索引和视图索引之间的区别是什么?
- 14. 列表分配和元组赋值之间的区别?
- 15. 自我分配之间的区别。和伊娃分配直接
- 16. ASP.NET 4中'(单引号)和“(双引号)之间的区别4
- 17. Bash中单引号和双引号之间的区别
- 18. jhipster登录OAuth配置和JWT配置之间的区别
- 19. 配置单元中的分区表
- 20. 配置单元中的分区表
- 21. PAM与Metis分区之间的区别
- 22. 区域适配器和区域行为之间的区别?
- 23. 行匹配和行之间的区别
- 24. 引用和数组索引之间的任何区别?
- 25. 击:$(猫)和之间的区别“美元”
- 26. OAK Lucene索引中indexNodeName和nodeName之间的区别
- 27. SQL Server中主键和唯一索引之间的区别
- 28. 之间的〜/和的区别../
- 29. master和gcloud分支之间的区别
- 30. cross_val_score和estimator得分之间的区别?