2011-08-15 70 views
2

我们得到了一些含有一些冗余,不良数据的数据库。举例来说,一些文章名称有大写小写字母差异,其他的重音问题,其他字母缺失等等。这个想法是合并实际上相同的db记录。数据清理:用户输入的数据库数据工具

有很好的工具,有允许容易清理数据库,理想的应该不会自动完成,但需要用户确认

回答

1

有相当多的工具,在那里进行数据清理。还有更多的公司提供数据清理服务。

我已经为几家大型企业进行了数据清洗,这不是一件容易的事情,或者看起来很简单,而且重复数据也充满了各种各样的问题,直到您开始锻炼才会显现出来。恕我直言,如果您的遗留数据处于相对较差的状态,并且您在这个(相当专业化的)领域没有内部专业知识,我会考虑聘请第三方为您做这件事,因为它们很可能以比从头开始的更低的总成本更快地执行它。

如果你想建立内部技能来做到这一点,那么我已经做了一些快速的谷歌搜索,并看到许多软件包提供,你可能想看看这些对方的相对优势您正在寻求清理的特定类型的数据,因为某些数据在某些区域会比其他区域更好。

希望这有助于, Ollie。