Lucene没有记录存储引擎的局限性。有谁知道每个文档允许的最大索引数量?lucene.net可以在文档中处理的索引的最大数量是多少
0
A
回答
1
对于所有类型的索引(Lucene,RDBMS或其他),建议尽可能少的字段进行索引编制,因为它可以使您的索引规模缩小并减少从索引读取运行时开销。
也就是说,字段数限制受限于您的系统资源。字段通过名称(区分大小写)来标识,而不是通过任意数字标识来标识,而这些数字标识通常会成为这些系统中的限制因素。在没有像Lucene这样严格的最大字段名称长度的系统中,理论字段数量限制也很难预测。
我个人使用了200多个分析字段,超过20亿个文档没有问题。与此同时,对于一个中等规模的Azure虚拟机来说,对于相同索引的性能并不是我期望的较小索引。
1
当提及术语数时,Lucene的当前实现使用Java int来保存术语索引,这意味着任何单个索引片段中唯一术语的最大数量是术语索引间隔的约21亿倍(默认128)= 〜274亿美元。这在技术上不是索引文件格式的限制,仅仅是Lucene当前的实现。
同样,Lucene使用Java int来引用文档编号,索引文件格式使用磁盘上的Int32来存储文档编号。这是索引文件格式和当前实现的限制。最终,这些应该替换为任何UInt64值,或者更好的是没有限制的VInt值。
相关问题
- 1. CVS可以处理的文件的最大大小是多少?
- 2. 可以存储在MongoDB集合中的文档的最大数量是多少?
- 3. flag_shih_tzu可以处理的最大标志量是多少?
- 4. socket.io可以处理的最大房间数是多少?
- 5. Lucene.NET获取最近索引的文档
- 6. EventMachine:EM可以处理的并行HTTP请求的最大数量是多少?
- 7. 我可以在Subversion中修改的最大数量是多少?
- 8. MQTT经纪人可以处理的主题最大数量是多少?
- 9. Couchdb文档中字段的最大数量是多少?
- 10. Jackson Csv到Json库可以处理的文件的最大大小是多少?
- 11. numpy.datetime64可以处理的最大时间戳是多少?
- 12. java.sql.Timestamp可以处理的最大年份是多少?
- 13. 您可以放在/ assets文件夹中的最大文件数量是多少?
- 14. 在弹性搜索中可以索引的字段的最大数量是多少?
- 15. 是否有可能在Lucene.net索引中取消删除文档?
- 16. lucene.net索引中的重复文档
- 17. HTML文档的元素或文件大小的最大数量是多少?
- 18. 可以通过GPRS传输的最大数据量是多少
- 19. MongoDB可以拥有的最大分片数量是多少?
- 20. wordpress循环可以使用的最大数量是多少?
- 21. 可以进入意图的最大附加数量是多少?
- 22. 检查索引中是否存在文档的条件(Lucene.NET)
- 23. 在Notepad ++中可以看到的最大记录数是多少?
- 24. 在Windows中可以使用的RAM的最大数量是多少?
- 25. 您可以在Manifest中定义的活动的最大数量是多少?
- 26. UNNotificationActions的最大数量是多少?
- 27. iPhone可以支持的纹理的最大尺寸是多少?
- 28. 片段着色器中纹理的最大数量是多少
- 29. ifstream :: ifstream可以读取的最大文件大小是多少
- 30. 我可以在SQL Server行中存储的最大数据量是多少?
你是什么意思“最大数量的索引”?索引由文档组成,文档由条款组成。你是指最大数量的字段? –
是的,这是正确的。你知道可以在文档中索引的最大字段数吗? – Luke101