1
A
回答
7
Soundex是一个非常古老而简单的英文单词哈希。它旨在匹配拼写错误的单词;例如“他们”,“他们”和“有”具有相同的Soundex代码。
Soundex的问题包括它严重偏向于英语,并丢弃太多的数据,因此有很多误报。一个更好的英文单词算法是Metaphone。
如果您正在寻找与西班牙拼写错误匹配的内容,则可以使用可以接受声音表格(例如“asta”和“hasta”)的Double-Metaphone算法。您必须创建您自己的表格,并且我听说双倍音频比单个音频慢了几个数量级。
另一种方法是更改Metaphone算法以使用西班牙音素而不是英语。有人已经done this in PHP。
相关问题
- 1. 有没有比libnotify更好的东西?
- 2. 有没有比reCaptcha更好的东西?
- 3. 比get_headers()更快的东西()
- 4. 比httrack更好的下载文件的东西?
- 5. 东西比.ToArray()更好的给力LINQ输出的枚举
- 6. 比图更好的东西<string,map <string,vector>
- 7. 在OSX中有没有比Navicat更好的东西?
- 8. 在JavaScript中有没有比setTimeout更好的东西?
- 9. 有没有比访问控制列表(ACL)更好的东西?
- 10. Perl:有没有比$ var = $ _;更好的东西?
- 11. 比标准库更好的东西c#正则表达式
- 12. 东西好&关于SharePoint坏东西
- 13. 将PDF刮到更友好的东西
- 14. VSTS Loadrunner或更好的东西?
- 15. 比Sprite/BufferedImage更有效的东西。
- 16. windows中的emacs好东西
- 17. 比较Python中的东西
- 18. 当时间非常关键时,有没有比NSTimer更好的东西?
- 19. 更新的东西在REST
- 20. 的东西更加明显
- 21. 是Redis的好东西,我需要
- 22. 类库中的资源好东西?
- 23. 更好的方法让java做随机的东西?
- 24. .Net 4.5中的新东西可以处理更好的JSON?
- 25. 更多的功能在一个控制器/东西/东西
- 26. 多个HTML东西的东西的东西
- 27. C - 虽然(东西||东西)
- 28. grep东西空间东西()
- 29. 复杂的东西在德比(Java DB)
- 30. Python正在打印比我想要的更多的东西
soundex是如何失败的? – phkahler