2011-11-09 38 views

回答

2

我会用Lucene的IndexMergeTool合并这些索引。如果您需要将此功能嵌入到其他工具中,本课程将使用IndexWriter#addIndexes。如果你不需要你的索引进行优化,你甚至可以使用IndexWriter#addIndexesNoOptimize,这可能会更快。

+0

嗨jpountz,可以说我发出以下命令之一,以合并这两个指标目录, IndexMergeTool指数1(60GB)索引2(10GB)destIndex和, IndexMergeTool索引2(10GB)索引1(60GB)destIndex 哪一个以上是将最小指数合并成最大指数的理想选择?或者, IndexMergeTool将如何决定与最大索引合并的最小索引? –

+0

Lucene MergePolicy将计算合并段的最佳顺序,因此您不需要执行任何操作。只要运行'IndexMergeTool dest index1 index2'。 (如果您对它的工作方式感兴趣,请参阅http://lucene.apache.org/java/3_2_0/api/all/org/apache/lucene/index/MergePolicy.html,自Lucene 3.2以来,默认实现是TieredMergePolicy,适用于旧版本的LogByteSizeMergePolicy)。 – jpountz

+0

嗨Jpountz,如果你不介意的话,你能否给我一个预测,将一个60GB的文件与一个10GB的文件合并需要多少时间? –

相关问题