2008-11-14 31 views
9

我有一组已输入和excel电子表格的名称和地址,但问题是许多输入地址的人以许多不同的非标准格式输入了它们。我希望在将所有地址传送到我的数据库之前清理地址。环顾四周,我真正发现的地址洗涤器(解析器或格式化器)的方式是由Semaphore推出的。出于我的目的,我并不需要所有这些,我也不想为软件的许可费支付费用。有没有什么是免费和/或开放源代码可以帮我擦洗?开源地址Scrubber?

+0

也许提供一些示例数据。 – Till 2008-11-17 14:21:36

回答

6

由于我在邮寄业务工作...

可邮寄地址没有地理编码。一个允许USPS发送邮件,另一个告诉你该地点在哪里。 USPS不会对其可邮寄地址进行地理编码。这对标记区域/地区进行定位非常有用。

您并未购买该软件的许可证,而是购买了该数据。邮局有很多规则,特别是如果你在商业上做这件事,并试图获得比一流的更好的速度。有关完整的规则列表,请参阅USPS Domestic Mail Manual。 USPS一直在拉链之间移动拉链和家庭。该公司(我工作)向USPS支付其更新的邮件列表,以便我们能够更新我们的数据库。每周。

回到你的问题。您是否想将数据更改为常用格式(街道 - > st),或者您是否在寻找重复项,并且只想存储真正的邮寄地址?

通用格式;你可以将地址分解成几部分,清理空白处并应用术语/翻译字典。然后应用一些SQL来查找重复项。请记住家庭(1个主要城市)与个人不同(John Doe,1个主要城市)。

为邮寄地址,以及你们中的一些人(读者)不会喜欢这个答案,但你想要的信息,这不是免费的。有人花费时间或金钱来获取和维护这些列表。因此,找一个商业模式来获取名单上的资金,或者找一个能为你做的人。 Data and mail management

实际上,Semaphore是相当便宜的,只要记住地址db将不得不季度更新和$ 19 /季度是相当便宜。

另一个地址洗涤产品。 SAP PostalSoft。我不知道数据会花费什么。

0

我与之合作过的大部分软件都非常昂贵(或者换句话说,营销部门天真并且预算庞大)。

这类工作是地理编码的先驱。这linked Wiki article包括地理编码软件的列表,其中一些是免费的。如果幸运的话,一些免费的可能包括地址标准化例程。

如果你找到一个好的,请告诉我。

0

我们使用Accuzip。它比大多数解决方案便宜很多(约700美元/年),并附带双月更新。它使用USPS地址标准化API,为此我编写了一个.NET包装器。这使我可以实时运行它(默认情况下,Accuzip仅带有批处理模式)。

3

我居然在地址验证行业工作NET包装...吉姆的回答是一个聪明的接受。不幸的是,对于我们这些预算较低的人来说,美国官方的USPS数据价格昂贵且系统复杂。 (我知道的经验,因为我工作的公司,SmartyStreets,提供的地址验证的速度比大多数都低)。

我可以在这里帮助的最好的建议是一个低成本/免费的替代品(取决于您的体积),比如LiveAddress,其中地址列表没有最低购买量,而API比较便宜且超级容易。

+0

更新:如果您仍然需要一个好的解决方案,地址验证API服务(在SmartyStreets)现在可以免费使用。 – Matt 2012-01-12 05:33:22