我有一个约有一百万行的表格,里面有500-600个文字,我正在这些文本中搜索单词。但是迭代行和在文本内搜索从时间方面来看效率不高。任何想法?文本搜索算法
文本搜索算法
回答
有了这个稀缺的信息,我建议你看看inverted indexes。据我所知,易于构建和快速检索您的案例。在任何类型的数据库环境中也很容易实现,以防无法切换到已经支持它们的数据库。
如果您提供更多信息,也许另一种解决方案也可以工作。
但我也使用levenshtein方法(edit_distance)来查看两个单词(用户输入的单词和数据库文本中的下一个单词)的相似程度。我们怎样才能以相同的方法使用倒排索引和levenshtein。我正在考虑。因为如果在文本中找不到'猫',我想给予回应,也许你正在搜索'帽子'有这样的文本,其中包括'帽子'或用户输入quute,'我认为你正在寻找'相当”'。 – Coenni
如果你想使用倒排索引和levensthein,你可以在一个trie中实现倒排索引。尝试支持Levensthein查找,如果你做得对。每一片叶子将包含所有匹配文件的清单。请在下次问题中提供更详细的信息,以便其他人直接找到合适的答案。 – LiKao
- 1. 文本搜索的最佳算法
- 2. 文件夹搜索算法
- 3. 搜索算法
- 4. 搜索算法
- 5. 树搜索算法
- 6. 跳搜索算法
- 7. SQLAlchemy搜索算法
- 8. MySQL搜索算法
- 9. .net搜索算法?
- 10. 搜索算法 - Java
- 11. 本搜索算法的问题C#
- 12. 推荐本地搜索优化算法
- 13. 搜索最佳点搜索算法
- 14. 快速算法搜索文本文件内的模式
- 15. 文本索引算法
- 16. DICOM文件的搜索算法c#
- 17. 想出一个搜索算法来搜索文档内
- 18. 搜索文本
- 19. 搜索文本
- 20. 算法来搜索文本中的单词列表
- 21. 本地文件搜索与迭代算法
- 22. SPARQL中的搜索算法?
- 23. C++线性搜索算法
- 24. 搜索算法导致StackOverFlowError
- 25. A *搜索算法卡住
- 26. 实现A *搜索算法
- 27. 3D对称搜索算法
- 28. 修改prestashops搜索算法
- 29. 使用A *搜索算法
- 30. 字符串搜索算法
你用什么方法来存储表格数据?平面文件? MySQL的?这对于你的问题 – Seph
mssql varchar(max)来说是一个相当重要的信息,但我可以改变存储方法。我正在使用的c#,mssql。 – Coenni