爪哇比较器，用于字节阵列（字典）

public class ByteComparator implements Comparator<byte> { 
    public int compare(byte b1, byte b2) { 
    return new Byte(b1).compareTo(b2); 
    } 
}

但是，这不会是字典：0xFF的（为-1的符号字节）将被视为小于0×00，当字典序是大。我想这应该做的伎俩：

public class ByteComparator implements Comparator<byte> { 
    public int compare(byte b1, byte b2) { 
    // convert to unsigned bytes (0 to 255) before comparing them. 
    int i1 = b1 < 0 ? 256 + b1 : b1; 
    int i2 = b2 < 0 ? 256 + b2 : b2; 
    return i2 - i1; 
    } 
}

大概有东西在Apache的公地郎或做这个公地数学库，但我不知道它关闭的手。

来源

2011-02-24 17:40:17

发现这个漂亮的代码在Apache中的HBase：

public int compare(byte[] left, byte[] right) { 
     for (int i = 0, j = 0; i < left.length && j < right.length; i++, j++) { 
      int a = (left[i] & 0xff); 
      int b = (right[j] & 0xff); 
      if (a != b) { 
       return a - b; 
      } 
     } 
     return left.length - right.length; 
    }

来源

2011-02-24 18:12:39 marcorossi

这基本上就是番石榴的'UnsignedBytes.lexicographicalComparator（）的非优化版本'做。 – ColinD 2011-02-24 18:25:13

嗯，当一个变量足够时，他们为什么要使用'i'和'j'。此外，存储'INT长度= Math.min（left.length，right.length）'和比较'I 2013-01-09 14:05:34

你会期望的是，阵列的长度字段将是昂贵 – marcorossi 2013-05-03 15:25:10

爪哇比较器，用于字节阵列（字典）

回答

相关问题