什么是最好的模糊匹配算法(模糊逻辑,N-Gram,Levenstein,Soundex ....)在更短的时间内处理超过100000条记录?最佳模糊匹配算法?
26
A
回答
21
我建议您阅读文章由纳瓦罗在维基百科的文章,题为 Approximate string matching的Refences部分中提到。 根据实际研究做出决定总是比随机 陌生人的建议更好。尤其是,如果在已知记录集上的表现对您很重要。
3
它大量依赖于您的数据。某些记录可以比其他记录匹配得更好。例如,邮编是一种定义的格式,因此可以以不同的方式与普通字符串进行比较。人们可以在缩写和DOB或其他组合上匹配。
相关问题
- 1. 使用模糊匹配算法比较数据元素的最佳方法
- 2. 模糊名称匹配算法
- 3. python中的最佳匹配算法
- 4. 匹配颜色的最佳算法。
- 5. 匹配HTTP路由的最佳算法
- 6. 算法问题:最佳匹配子集
- 7. MySQL搜索算法最佳匹配
- 8. 模糊匹配
- 9. 匹配排名的最佳匹配算法?
- 10. 寻找与“模糊”排名逻辑的最佳匹配
- 11. 如何找到最佳的模糊字符串匹配?
- 12. PHP模糊搜索2列并返回最佳匹配
- 13. Java中实现的最佳模式匹配算法
- 14. 经济模拟的最佳匹配算法?
- 15. 模糊匹配SQL
- 16. Solr/lucene最大字符模糊匹配
- 17. 使用模糊匹配重复数据删除流处理的最佳做法
- 18. 自动化文本/模糊匹配的最佳机器学习方法
- 19. 最佳分配算法
- 20. 模糊搜索目录名称的最佳算法
- 21. 产品标题的模糊字符串匹配算法
- 22. 在Python中改进模糊匹配算法
- 23. 使用bitap算法寻找模糊匹配
- 24. 段落中模糊匹配多词短语的算法
- 25. 模糊文本匹配
- 26. 模糊文本匹配C#
- 27. 坐标模糊匹配
- 28. 模糊字符串匹配
- 29. 模糊匹配地址
- 30. Python硒和模糊匹配
我想象@米奇小麦*意味着*要说的是,对这个问题给出明确的答案是非常困难的,因为最好的解决方案将会严重依赖于您的输入和系统架构的特点。正如Tim在他的回答中提到的那样,你应该阅读这些算法的长处和弱点,然后测试那些看起来适合自己的算法。 – DougW 2012-01-17 22:43:10