0

据我所知,散列/倒排索引分别将值/字映射到记录/文档。 然而,散列索引中的插入复杂度较低(因为它在溢出的情况下添加了一个新的存储区),但倒数索引更多(由于保留了排序的文档ID列表)。 这是否意味着它们本质上是相同的,除了实现?散列索引vs倒排索引

+0

看来你谈一些具体的技术,但没有命名,并把标签 – leventov 2015-04-03 17:54:41

+0

我说的是使用散列关系数据库中的索引以及Web文档搜索中的倒排索引。让我看看我是否可以添加他们的标签。 – 2015-04-05 21:49:13

回答

1

据我所知,与倒排索引相比,散列索引用于完全不同的用例/场景。散列索引只是从索引键到内存中给定行的确切位置的映射(主要用于关系数据库中的内存优化表),而倒排索引实际上是从单词到其所在文档的映射遏制。

所以,如果我们看一下,一个单词可能包含在许多文档中,并且文档将被许多这样的单词共享。因此,在倒排索引的情况下,许多键指向在很多这样的键上通用的文档id,而在散列索引的情况下,键指向的数据,即行数据可能彼此完全不相关。

因此,它们与解决完全无关的情况并不相同,并且实施方式非常不同。

有关倒排索引更多的信息,你可能指的是张贴在这里:BigData: Inverted Index