2
A
回答
1
由于反转的指标是所有存储在文档中的单词和他们的位置之间的关系,我不知道这的确是一个不错的用例的NoSQL。传统的SQL在这里会更好。例如,尝试的数据结构是这样的:
Documents (DocumentID primary key, DocumentText text)
Words (WordID primary key, Word text)
Instances (InstanceID primary key, WordID foreign key, DocumentID foreign key, WordIndex integer)
采用这种结构,当你插入文档到Documents
表,你分析出每个单词,并把它添加到Words
表,如果它是新的或检索现有如果它已经存在,则将其添加到Instances
表中。
如果您打算使用NoSQL,您可以将它用于MongoDB之类的东西,并将所有文档放在一个集合中,并将所有文档放在另一个集合中。在每个Word
文档中,包含一个Instances
数组,该数组可以是关联文档的ObjectID
和该文档中的单词索引的对象数组。但是,我不确定MongoDB是否针对文档中的大型数组进行了优化。常见单词如'a'和'the'最终可能超过4MB文档限制,具体取决于您拥有的数据量。
0
- 分布式,可扩展性和高可用性
- 实时搜索和分析能力
- 复杂的RESTful API
相关问题
- 1. 搜索引擎中的倒排索引
- 2. Java - 倒排索引
- 3. 什么是在.NET中使用的好的倒排索引库?
- 4. 散列索引vs倒排索引
- 5. Python倒排索引效率
- 6. Python - 查询倒排索引
- 7. 倒排索引节点addword
- 8. Apache lucene倒排索引
- 9. 高效的方式使用倒排索引排名最高的搜索结果
- 10. MongoDB中的位置倒排索引
- 11. 优化倒排索引的Java
- 12. 手动搜索倒排索引
- 13. 模糊搜索+倒排索引
- 14. 在Elasticsearch中获取索引文档的倒排索引
- 15. Lucene倒排索引访问计数
- 16. 仅将Lucene用作倒排索引
- 17. MySQL索引:倒排或正向
- 18. 在倒排文件索引上查询
- 19. 帮助建立倒排索引
- 20. 倒排索引:在一组文档
- 21. 如何制作倒排索引?
- 22. Hadoop倒排索引程序错误
- 23. 索引和倒排索引在solr中如何工作?
- 24. 把倒排引号围绕使用索引的字符串,python
- 25. 在倒排索引中搜索一个正常的查询
- 26. Cassandra中的二级索引和倒排索引之间的区别是什么?
- 27. 颠倒索引的行,python
- 28. 在Java中创建倒排索引的最佳数据结构是什么?
- 29. 这是最好的索引吗?
- 30. noSQL数据库中的双重索引