我必须每月在HBase表中存储有关实体的信息。我想处理迄今为止使用mapreduce逻辑的实体的所有月份详细信息。我很困惑是否选择HBase桌子的高窄或宽扁设计。HBase表格设计 - 高窄窄平坦的方法
使用扁平宽方法,实体Id将保留为行键和月份id作为列限定符,并且详细信息为限定符值。在HBase-mapreduce中,我可以获取地图和过程中实体的所有详细信息。
高窄方法将存储行键作为实体ID和月份的组合。此外,细节将存储在一个单独的列中。在HBase-mapreduce中,我必须获取详细信息,以便在缩减器中查找map和aggregate中的所有月份。
哪种方法更好,性能更好?提前致谢。
所以你必须在一个月内存储一次信息??另外,锄头多? – Tariq
信息粒度是每月。可能发生的情况是,一个实体的特定月度信息可以更新频率更高。要存储的信息包含500个键值。可能有数百万个这样的实体。我没有确切的数字数据。 – InfamousCoconut