SQL删除子查询，删除重复记录

我想写一个查询，从下表（valid_columns）删除重复的记录，并保留只有尽可能最低的[订单]号码的记录。SQL删除子查询，删除重复记录

例如，在下表中，我想删除重复的行，区域2,3和作业3，并保留记录的最低可能[顺序]。

E.g.输入表，valid_columns看起来是这样的：

name col_order 
------------- 
job  1 
job  3 
status 2 
cust 2 
county 1 
state 1 
region 1 
region 2 
region 3 
so  4

所需的输出：

name col_order 
------------- 
job  1  
status 2 
cust 2 
county 1 
state 1 
region 1 
so  4

我试图修复一个错误，我想不通的SQL。目前它使用删除语句和子查询。目前使用的查询是这样的：

- 3）删除重复列

DELETE 
FROM valid_columns 
WHERE NOT (col_order = (SELECT TOP 1 col_order 
      FROM valid_columns firstValid 
      WHERE name = firstValid.name 
      AND col_order = firstValid.col_order 
      ORDER BY col_order ASC))

但是，这仅返回以下，这是不正确的：

name col_order 
------------- 
job  1 
county 1 
state 1 
region 1

非常感谢

来源

2011-07-05 bobbo

DELETE FROM t1 
FROM valid_columns t1 
WHERE col_order > 
    (SELECT MIN(col_order) from valid_columns t2 WHERE t1.name = t2.name)

编辑： 可以简化为这样：

DELETE FROM valid_columns 
    WHERE col_order > 
     (SELECT MIN(col_order) from valid_columns t2 WHERE valid_columns.name = t2.name)

的DELETE语句可以使用FROM子句删除基于第二个表中相关记录值的记录。在这种情况下，FROM不是真正必需的（我有时使用FROM来别名表名，因为我不喜欢额外的输入。）

DELETE FROM TableA 
FROM TableA 
JOIN TableB On TableA.CriteriaA = TableB.CriteriaA

你也可以尝试这个例子（可能会更快，如果你必须这样做了许多）：

DELETE FROM valid_columns 
WHERE EXISTS 
    (SELECT * FROM valid_columns t1 
    WHERE t1.name = valid_columns.name AND valid_columns.col_order > t1.col_order);

来源

2011-07-05 14:15:30 jim31415

在where子句中使用相关的子查询时，我有点困惑，你能简单地展开你的答案。它看起来会起作用。 – bobbo

试试这个（你可以使用select来替换delete，以确保在删除之前得到正确的结果）。

DELETE FROM [valid_columns] t1 
WHERE col_order > (SELECT MIN(col_order) from [valid_columns] t2 
     WHERE t1.name = t2.name)

来源

2011-07-05 13:56:49 Narnian

-- Test table 
declare @T table(Name varchar(10), col_order int) 

-- Sample data 
insert into @T 
select 'job',  1 union all 
select 'job',  3 union all 
select 'status', 2 union all 
select 'cust', 2 union all 
select 'county', 1 union all 
select 'state', 1 union all 
select 'region', 1 union all 
select 'region', 2 union all 
select 'region', 3 union all 
select 'so',  4 

-- Delete using CTE and row_number() 
;with cte as 
(
    select row_number() over(partition by Name order by col_order) as rn 
    from @T 
) 
delete from cte 
where rn > 1 

-- Result 
select * 
from @T

或用一个子查询，而不是CTE

delete vc 
from (select row_number() over(partition by Name order by col_order) as rn 
     from valid_columns) as vc 
where vc.rn > 1

来源

2011-07-05 13:58:30

这应该做你需要的东西：

DELETE FROM valid_columns a 
WHERE (SELECT MAX(col_order) 
    FROM valid_columns b 
    WHERE a.name = b.name) > a.col_order;

我建议先进行数据的备份之前测试尽管如此。

来源

2011-07-05 13:59:06 EdoDodo

或者您可以使用游标遍历表并在临时表中插入遇到的第一个值（确保临时表具有为名称列指定的唯一约束）。

编辑：我已经包括了方便的代码片段...

declare @Ti table(name varchar(10), col_order int); 
declare @Tf table(name varchar(10) unique not null, col_order int not null); 

declare @name varchar(10); 
declare @col_order int; 

-- Sample data 
insert into @Ti 
select 'job',  1 union all 
select 'job',  3 union all 
select 'status', 2 union all 
select 'cust', 2 union all 
select 'county', 1 union all 
select 'state', 1 union all 
select 'region', 1 union all 
select 'region', 2 union all 
select 'region', 3 union all 
select 'so',  4 

select * from @Ti 

declare i cursor for 
    select * from @Ti; 

open i; 
fetch next from i into @name, @col_order; 

while @@FETCH_STATUS = 0 
begin 
    if not exists(select * from @Tf where name = @name) 
    begin 
     insert into @Tf(name, col_order) 
      select @name, @col_order; 
    end 

    fetch next from i into @name, @col_order; 
end 

close i; 
deallocate i; 

select * from @Tf;

来源

2011-07-05 14:05:44 npclaudiu

删除记录与二进制校验（这是工作在任何SQL Server版本）

 

CREATE TABLE #t1(ID INT NULL, VALUE VARCHAR(2)) 
INSERT INTO #t1(ID, VALUE) VALUES (1,'aa') 
INSERT INTO #t1(ID, VALUE) VALUES (2,'bb') 
INSERT INTO #t1(ID, VALUE) VALUES (1,'aa') 
INSERT INTO #t1(ID, VALUE) VALUES (1,'aa') 
INSERT INTO #t1(ID, VALUE) VALUES (3,'cc') 
INSERT INTO #t1(ID, VALUE) VALUES (3,'cc') 
GO 

-- BINARY_CHECKSUM(): are columns that we want to compare duplicates for 
-- if you want to compare the full row then change BINARY_CHECKSUM() -> BINARY_CHECKSUM(*) 

-- for SQL Server 2000+ a loop 
-- save checksums and rowcounts for duplicates 

SELECT BINARY_CHECKSUM(ID, VALUE) AS ChkSum, COUNT(*) AS Cnt 
INTO #t2 
FROM #t1 
GROUP BY BINARY_CHECKSUM(ID, VALUE) HAVING COUNT(*)>1 

DECLARE @ChkSum BIGINT, @rc INT 

-- get the first checksum and set the rowcount to the count - 1 
-- because we want to leave one duplicate 

SELECT TOP 1 @ChkSum = ChkSum, @rc = Cnt-1 FROM #t2 

WHILE EXISTS (SELECT * FROM #t2) 
BEGIN  
    -- rowcount is one less than the duplicate rows count 
    SET ROWCOUNT @rc 
    DELETE FROM #t1 WHERE BINARY_CHECKSUM(ID, VALUE) = @ChkSum 
    -- remove the processed duplicate from the checksum table 
    DELETE #t2 WHERE ChkSum = @ChkSum 
    -- select the next duplicate rows to delete 
    SELECT TOP 1 @ChkSum = ChkSum, @rc = Cnt-1 FROM #t2  
END 
SET ROWCOUNT 0 
GO 

SELECT * FROM #t1 

-- for SQL Server 2005+ a cool CTE 
;WITH Numbered 
AS 
(
    SELECT ROW_NUMBER() OVER (PARTITION BY ChkSum ORDER BY ChkSum) AS RN, * 
    FROM (
      SELECT BINARY_CHECKSUM(ID, VALUE) AS ChkSum 
      FROM #t1 
     ) t 
) 
DELETE FROM Numbered WHERE RN > 1; 
GO 

SELECT * FROM #t1 

DROP TABLE #t1; 
DROP TABLE #t2;

来源

2011-07-06 12:59:39

SQL删除子查询，删除重复记录

回答

相关问题