A BK Trees (Burkhard-Keller Trees)与模糊字符串搜索(例如拼写检查,单词推荐)相关联。所有的BK树搜索算法都与explained here相同。目标是返回,例如"seek" and "peek" if I search for "aeek"。 现在,我的问题是,我想利用这个模糊字符串搜索算法来搜索从所有类似的项目给予词典。例如,给一个词“寻找”,我想找到全部类似的单
我正在清理一个我继承的脏数据库,并且需要对模糊匹配名称进行人工审查。我提出了一个可行的解决方案,但速度非常慢 - 15k行7分钟。我有这种感觉,我忽略了一些非常简单的解决方案。 记录示例: 1 John Smith
2 John Q Smith
3 Janway Smith
4 Jane Chen
5 David Jones
6 Natalia La Brody
7 Natalia L