考虑与存储在MySQL数据库中的位置的记录倒排索引:你如何添加新文档到一个倒排索引
Word (VARCHAR) | Documents (LONGTEXT)
-------------------------------------------------------------
Hello | {id: 11, freq: 4, pos: [18, 37, 43, 119]},
| {id: 19, freq: 2, pos: [17, 32]}
-------------------------------------------------------------
现在,一个新的文件来和它的大多数话都已经编入索引。现在应该是什么索引操作?基本方法似乎是,如果该单词已经存在于数据库中,那么获取它的文档并将当前文档添加到它并更新记录。
这是可持续的文件达到增加,比方说,数以百万计的数目? Solr,Xapain,Google,Bing等真实世界的搜索引擎如何处理这个问题?