2011-07-25 32 views
4

SQL Server 2008中,我继承了一个表像这样(74K行):SQL服务器删除重复与扭曲

create table #mess (keycol char(36) , name1 varchar(254) , name2 varchar(254), valuex varchar(254)) 
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , 'a' , '' , '') 
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , '' , 'a' , 'value-a') 
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , 'b' , '' , 'value-b') 
insert into #mess values ('578F2893-15E6-4877-9FE6-AC2F4F351143' , 'c' , '' , 'value-c') 
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , '' , 'b' , '') 
insert into #mess values ('FAFCBDFE-D49E-4566-882D-0B6628DA59CC' , '' , 'd' , 'value-d') 

这使得这个结果集:

keycol        name1 name2 valuex 
------------------------------------ ------- -------- ------------ 
971EC307-8514-450D-AE3A-4E25EA3F3A10 a     
971EC307-8514-450D-AE3A-4E25EA3F3A10   a  value-a 
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F b    value-b 
578F2893-15E6-4877-9FE6-AC2F4F351143 c    value-c 
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F   b   
FAFCBDFE-D49E-4566-882D-0B6628DA59CC   d  value-d 

我需要做像这样(脱复制和基于在使用name1如果name2keycol两行之间的匹配,并在折叠中的数据,是空的,并且反之亦然但总是用name1始终使用非空valuex栏)。所有的想法都赞赏

谢谢。

keycol        name1 valuex 
------------------------------------ ------- ------------ 
971EC307-8514-450D-AE3A-4E25EA3F3A10 a  value-a 
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F b  value-b 
578F2893-15E6-4877-9FE6-AC2F4F351143 c  value-c 
FAFCBDFE-D49E-4566-882D-0B6628DA59CC d  value-d 
+0

是空格还是空字符串? – SQLMason

+0

它们是空字符串。谢谢。 – Snowy

回答

0

您可以使用COALESCE()函数。它接受任意数量的参数,并返回第一个非NULL值作为结果。

编辑: SELECT KEYCOL,COALESCE(1,名称),valuex GROUP BY KEYCOL

确定。显然错了..谢谢指出。我刚刚完成醒来.... mondays ...

+0

我认为您需要在您的示例中向groupby添加valuex,或者可能向其添加Coalesce。很好的解释btw。 –

+0

和COALESCE字段 - 除非它们在GROUP BY子句中,否则不能在GROUP BY中使用任何非聚合字段。 – mwigdahl

+0

此语法在SQL Server中无效,因为您是按keycol分组的,但您没有使用其他列中的聚合函数 – Lamak

0

这样的事情?

create table #mess (keycol char(36) , name1 varchar(254) , name2 varchar(254), valuex varchar(254)) 
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , 'a' , '' , '') 
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , '' , 'a' , 'value-a') 
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , 'b' , '' , 'value-b') 
insert into #mess values ('578F2893-15E6-4877-9FE6-AC2F4F351143' , 'c' , '' , 'value-c') 
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , '' , 'b' , '') 
insert into #mess values ('FAFCBDFE-D49E-4566-882D-0B6628DA59CC' , '' , 'd' , 'value-d') 

select * from #mess 

select 
    n1.keycol, coalesce(n1.name1, n2.name1), n1.valuex 
from 
    (
     select keycol, max(nullif(name1, '')) name1, max(nullif(valuex, '')) valuex 
     from #mess 
     group by keycol) n1 
    inner join (
     select keycol, max(nullif(name2, '')) name1, max(nullif(valuex, '')) valuex 
     from #mess 
     group by keycol) n2 
     on n1.keycol = n2.keycol 

drop table #mess 
0

看起来好像数据结构就是这样,你永远只是希望每个KEYCOL非NULL valuex行。你应该能够做到这一点,和折叠NAME 1和NAME在一起,通过消除与UNION像这样的空valuex行:

SELECT keycol, name1, valuex 
FROM tablename 
WHERE valuex != '' AND name1 != '' 
UNION 
SELECT keycol, name2 AS name1, valuex 
FROM tablename 
WHERE valuex != '' AND name2 != '' 

如果总有一款适合每个KEYCOL只是一个有效的valuex行,这应该工作。如果情况并非如此,那么请告诉我,我会进一步修改。

1

顺便说一句 - 右边的3列基本上是相同的。您可以放弃最右边的值(如'value-a'等值),然后再合并其他两个值。

反正 - 一对夫妇不同的方式 - 使用DISTINCT,或者GROUP BY得到你想要的东西:

使用DISTINCT:

SELECT DISTINCT 
    keycol, 
    Coalesce(NULLIF(name1,''), name2) as name1, 
    'Value-' + Coalesce(NULLIF(name1,''), name2) as valuex 
FROM 
    Table 

使用GROUP BY:

SELECT 
    keycol, 
    Coalesce(max(nullif(name1,'')), max(name2)) as name1, 
    max(valuex) 
FROM 
    table 
Group By 
    keycol