2013-03-08 28 views
0

是否有指导处理数据库设置中的专有名称?我有2个数据集,其中有专用名称作为主键,但在两组数据格式上有很大差异。此外,由于各种姓氏的风格和连字符,甚至很难确定名字,中间和姓氏。关于在数据库中匹配专有名称的建议

我讨论从头开始重新创建数据,但不知道处理名称的一套好的最佳实践是什么样子(比如,我应该使用first,middle,last还是merge last,等等。)?

任何建议对我的理智都很好。谢谢。

+2

如何将名称用作主键?仅在美国就有成千上万的“约翰史密斯”,你肯定会在某个时候发生碰撞。 – alroc 2013-03-08 21:10:16

+1

没有这样的标准名称格式。冰岛人通常只有一部分是你的名字。在许多欧洲国家,以您的名字命名四个或五个部分并不罕见。强迫人们进入“第一”,“中间”和“最后”的名字只会激怒很多人。 – tadman 2013-03-08 21:14:19

+0

如果您要从头开始重新创建,请在独立字段中创建一个独立的(最好是整数)主键和所有名称组件:'First','Middle','Last'和(如果您想要看起来)'Prefix'和'Suffix'。 – 2013-03-08 21:14:49

回答

1

是的 - 指导是。不要这样做。您可以简单地创建一个UNIQUE列,使名称+新唯一ID列成为唯一的,请记住,这不是全局性的,它取决于您的环境。

否则,你会想要使用类似名称+邮编+ dob +/-唯一ID。

这会给你一个更好的回旋处理这些表时。此外,如果这是您参与的项目,则可能需要考虑向主管提出数据库设计问题。因为这不是好的做法...