2011-05-25 96 views
0

我使用Lucene搜索HTML文档。我遇到的问题是增加索引文件的大​​小,我有300-400MB大小的HTML文件,但索引运行到了.98Gb。我看到的原因是因为我们有规范。就像我们为四个不同的领域索引相同的内容,我认为这是问题(我们使用相同的内容,一个区分大小写和其他方式,一个区域用特殊字符和其他方式敏感)。减少Lucene索引的内存大小

有没有办法缩小索引的大小?保持相同的要求?有没有不同的方式,我们索引相同和不同的搜索支持所有?

回答

1

我假设你的问题是,你正在存储这些领域,而不是索引他们。所以解决方案是:不要存储它们。

+0

啊,这是我的问题。这是一个巨大的变化,大小超过200MB ..谢谢吨Xodarap,我应该想通了..但.. – remo 2011-05-25 17:55:39