2011-07-24 96 views
0

我们遇到成员尝试注册多个帐户以利用推荐奖励和免费试用奖励的问题。我们需要一个邮寄地址,并根据USPS进行验证,但发现这仍然不能提供足够的保护,并且对于用户更改像“第2行”那样的地址的元素并且仍然有效仍然太容易。检测邮寄地址相似度

如果一个不同的用户已经注册了一个地址,最好的方法是什么?

地址变化的例子:

59格兰特大道 楼2

59格兰特大道 套房2

与任何类似的确切比较的问题是,一个街道地址可能有多个租户在不同的公寓/办公室等

我们正在使用Rails 3,MySQL,Memcache,Sphinx

回答

1

虽然处于不同的环境中,但我们仍面临类似的问题。没有那么多你可以做的,我们基本上写了一种方法,试图根据规范化的电话号码,规范化的街道地址,Leveshtein distance的名称和地址,地理编码地址时的物理距离等来识别可能的重复。重复仍然需要一个人,但至少可以显着减少可能的候选人的数量。

+0

我认为可能是这种情况。我们还没有尝试Leveshtein距离,所以也许这是下一步。 – chrishomer

0

它需要智能来可靠地做到这一点,所以你可以忘记算法。我认为你可以做的最好的是报告与已经提交的地址类似的地址,然后将其留给一个人来决定。