我有一个将存储和跟踪访问者的应用程序。这些访问者在设置访问时根据需要由调度程序(用户)在系统中创建。问题是,大部分的时间是访问者的唯一重要的唯一标识符如下:名称匹配字典,用于查找名字和姓氏变体
- 名
- 姓
- 公司名称
的重复记录现有风险因为同一个人是固有的,调度人员可以输入一个新的访问者记录来替代为该名称存在的人搜索系统。
当我遇到有人以同样的名字进入一个访问者时,我会显示一个警告对话框,提供这个人可能是谁的各种建议,但是即使那样也不够好。
我可以输入'Jim Jones',这个人可能在系统中存在'詹姆斯琼斯'或'吉米琼斯'。我看到有可用的名称识别软件包,但它们很昂贵,而且肯定比我所寻找的要重。
有人会知道在哪里可以找到一个免费或开源词典文件,我可以通过编程方式访问以查找潜在的名称变体?软件或在线服务会很好,但即使只是一个数据转储或简单的文本文件也可以。
我知道即使这不会阻止重复的访客记录,我只是试图保持在最低限度,所以它不是一个关键功能。
我想从上面的设计说明中澄清一下,当我说一个调度程序可能会输入一个新的访客记录来代替搜索系统时,我的意思是说这种行为是通过设计的。用户群将被假定为具有最小的计算机技能,因此需要干净简单的手持流量。 – 2011-05-06 12:47:56