1
我使用django haystack + whoosh作为搜索后端。Haystack和whoosh索引大小
当我运行索引更新时,它简单地创建具有相同大小和索引的新索引文件增长非常快(假设我的内容变化很快,我希望保持索引新鲜并每5-10分钟更新一次)。
那么这种行为是否可取?我可以减少索引大小吗?也许whoosh不能愚蠢地做出新的完整索引文件,但使用一些delta来保持索引更小?
我使用django haystack + whoosh作为搜索后端。Haystack和whoosh索引大小
当我运行索引更新时,它简单地创建具有相同大小和索引的新索引文件增长非常快(假设我的内容变化很快,我希望保持索引新鲜并每5-10分钟更新一次)。
那么这种行为是否可取?我可以减少索引大小吗?也许whoosh不能愚蠢地做出新的完整索引文件,但使用一些delta来保持索引更小?
我知道Whoosh提供了一个IndexWriter对象,可用于向索引中添加某个文件,而无需重新索引所有内容,但我不确定如何使其与Haystack协同工作。也许类似
from haystack import site
site.get_index(model).update_object(instance)
这不是我的选择。看起来像每次使用--noinput选项重新创建索引更容易,并且当数据量增长很多时,只会将whoosh更改为xapian或solr。 – Novarg