2012-05-16 51 views
-2

我有几百万的名字保存在我的数据库中的这些名字都不过是客户的姓名,
我不得不集群它们发音上相似,内部对方的名字,
一个办法,我现在用的就是匹配各名与基于声音前,元电话数据库中读取一些选择性相似的名字,initials..etc
但它是非常缓慢的,
现在我想生成唯一ID为每个名字和集群相似的唯一的ID, 但我无法生成唯一的ID。 那里名称是印度名称和使用英文字母书写。
是否有任何聚类相似名称的算法。 请帮忙聚类数据

+0

http://stackoverflow.com/questions/7946192/good-algorithm-for-matching-nam ES – bmargulies

回答