我必须在数据库中存储数百万条目。每个条目由一组唯一的整数标识符标识。例如,一个值可能由一组10个整数标识符标识,每个整数标识符少于1亿个。将许多有界整数打包成一个大整数
为了减少数据库的大小,我想到了使用单个32位整数值的以下编码。
Identifier 1: 0 - 100,000,000 Identifier 2: 100,000,001 - 200,000,000 . . . Identifier 10: 900,000,001 - 1,000,000,000
我正在使用Java。我可以编写一个简单的编码/解码方法。用户代码在获取/存储期间不必知道我是编码/解码。
我想知道的是:什么是实现这种编码/解码的最有效(最快)和推荐的方式。一个简单的实现将执行大量的乘法/减法。
是否可以使用移位(或按位操作)并选择不同的分区大小(每个分段的大小仍然接近1亿)?
我接受任何建议,意见或甚至完全不同的计划。我想利用整数标识符有界的事实来大幅减少存储大小,而不会明显降低性能。
编辑:我只是想补充一点,我经历了一些在这个论坛上发布的答案。一个常见的解决方案是分割每个标识符的位。如果我为总共10个标识符的每个标识符使用2位,那么我的标识符范围受到严重限制。
你不得不使用2的幂来获得位移。 – MeBigFatGuy 2012-04-10 15:37:46
你能举一个这样的编码整数如何看起来像(以及如何手动解码)的例子吗?请使用任意ID(例如'144,560,000','200,0158,945','399,888,777'等) – Thomas 2012-04-10 15:38:38
请注意,如果您想将10个ID插入32位)。因此每个ID最多只能有8个不同的值。 – Thomas 2012-04-10 15:40:14