从基数256转换为多基数并返回的算法

我有一个字节数据流，也称为基数256个符号。什么是最好的算法，在理想情况下将其转换为新的符号流，每个符号的基数变化并且只在运行时才知道？输入字节流和目标基数列表的长度都很长但是有限。所有非负整数，无浮点。此外，目标基数不能保证均匀分配或是256的倍数。从基数256转换为多基数并返回的算法

来源

2015-11-03 Reinderien

确实输出流需要具有任何特殊性能（如以某种方式的数字），或者你只需要能够从输出流和基数得到原来的流背清单？ –

@MattTimmermans基本上，分开指定基数的非负整数。是的，原始流必须稍后恢复。 – Reinderien

您的问题是算术编码的一个子集，它被用作许多压缩算法的最后一个阶段。这是最酷的事情在CS学习一种：

http://www.drdobbs.com/cpp/data-compression-with-arithmetic-encodin/240169251 https://en.wikipedia.org/wiki/Arithmetic_coding

如何您的问题具体涉及：

你想要的编码器是算术解码器，并为每个解码您将使用一个不同大小的字母表（基数），所有符号的概率相同。

编码器的主循环会做这样的事情：

int val=0; //information from the stream 
int range=1; //val is in [0,range) 
while(...) 
{ 
    int radix = next_radix(); 
    //ensure adequate efficiency 
    while(range < radix*256) 
    { 
     val = (val<<8)|(next_byte()&255); 
     range<<=8; 
    } 
    int output = (int)(radix*(long)val/range); 
    //find the smallest possible val that produces this output 
    int low = (int)((output*(long)range+radix-1)/radix); 
    //find the smallest possible val that produces the next output 
    int high = (int)(((output+1)*(long)range+radix-1)/radix); 
    val-=low; 
    range = high-low; 
    write(output); 
}

没有与处理终止的条件和处理在您的解码器进行（算术编码器）的并发症，所以你必须阅读文学，从我链接的东西开始。尽管如此，我希望这能够让你了解它的工作原理。

好运

来源

2015-11-03 14:23:05

是否这样：'（out * self._range + radix - 1）/ radix'没有评估这个？ '（out * self.range - 1）/ radix + 1'？同样，'（（out + 1）* self._range + radix-1）/ radix' ='（（out + 1）* self._range - 1）/ radix + 1' – Reinderien

当out = = 0，因为整数除法舍去而不是舍入。（A + B-1）/ B是四舍五入的，（A +（B >> 1））/ B是四舍五入到最近的A/B，并且A/B是A/B向下取整。 –

从基数256转换为多基数并返回的算法

回答

相关问题