2011-10-18 81 views
0

这基本上是一个二叉树对哈希首先搜索,以决定它是否是其leftright这是TokyoCabinet的错误吗?

if(hash > rec.hash){ 
    off = rec.left; 
    entoff = rec.off + (sizeof(uint8_t) + sizeof(uint8_t)); 
} else if(hash < rec.hash){ 
    off = rec.right; 
    entoff = rec.off + (sizeof(uint8_t) + sizeof(uint8_t)) + 
    (hdb->ba64 ? sizeof(uint64_t) : sizeof(uint32_t)); 
} else { 
    if(!rec.kbuf && !tchdbreadrecbody(hdb, &rec)) return false; 
    int kcmp = tcreckeycmp(kbuf, ksiz, rec.kbuf, rec.ksiz); 
    if(kcmp > 0){ 
    off = rec.left; 
    ... 
    } else if(kcmp < 0){ 
    off = rec.right; 
    ... 

这里的哈希如何计算出来的:

static uint64_t tchdbbidx(TCHDB *hdb, const char *kbuf, int ksiz, uint8_t *hp){ 
    ... 
    uint32_t hash = 751; 
    const char *rp = kbuf + ksiz; 
    while(ksiz--){ 
    ... 
    hash = (hash * 31)^*(uint8_t *)--rp; 
    } 
    *hp = hash; 
    ... 
} 

但似乎哈希计算不能的方式确保密钥的有序性,

它是一个错误?

回答

2

它并不是试图通过键本身的值来排序键。它首先通过哈希来排序,然后通过哈希碰撞的关键值排序。

所以不,它不是一个错误。除非您可以引用文档说明这种类型的表按关键值进行排序。

+0

这不是一种类型的树,这只是对按键的排序。所以操作的性质将取决于树的类型。 –

+0

平衡安全吗?IMO重新平衡后可能找不到一些记录。 –

+0

那么平衡是什么意思呢?通常,平衡一棵树时,记录不会丢失,也不会重新排序。平衡一棵树实际上是透明的。 –