2011-06-21 17 views
0

我们正在从外部来源导入数据。这些数据没有全局密钥,所以我们有Varchars,日期等。没有唯一密钥的数据比较

问题是:如何使Varchar比较的性能更好?此外,它有任何工具,可以允许看到匹配百分比(像行的相似度:90%)

谢谢!

回答

2

虽然没有直接回答你的问题,如果你要导入数据则集成服务(如果你是尚未使用它)将是一个不错的选择。 SSIS中包含的一些转换允许“模糊匹配” - 即基于相似度的置信水平匹配数据。

+0

请问我可以在哪里找到如何开始使用SSIS的简单步骤?这看起来很棒! – user194076

+0

创建一个简单的ETL包:http://msdn.microsoft.com/en-us/library/ms169917.aspx - http://msdn.microsoft.com/en-us/library/ms167031.aspx –

+0

请参阅模糊查找转换:http://msdn.microsoft.com/en-us/library/ms137786.aspx –

1

为了找到“同类”匹配,你可以使用一个听起来像比较:

WHERE SOUNDEX(some_column) = SOUNDEX(‘some_string’) 
+0

哇,从来没有听说过这个功能。谢谢! – user194076