我已经写了一个查询,它返回下列数据。SQL中RowNum的有条件选择
ID EmpFirstName EmpLastName RowNum
1 X Y 1
2 A B 1
3 A B 2
现在我想要RowNum
> 1的所有记录。例如,在这种情况下,我需要输出2和3记录。
如果我把条件RowNum >1
然后我只会得到第三条记录,但我也想要2。
我已经写了一个查询,它返回下列数据。SQL中RowNum的有条件选择
ID EmpFirstName EmpLastName RowNum
1 X Y 1
2 A B 1
3 A B 2
现在我想要RowNum
> 1的所有记录。例如,在这种情况下,我需要输出2和3记录。
如果我把条件RowNum >1
然后我只会得到第三条记录,但我也想要2。
假设你的查询是这样的:
select ID, EmpFirstName, EmpLastName,
ROW_NUMBER() OVER (PARTITION BY EmpFirstName, EmpLastName ORDER BY ID) AS RowNum
FROM aTable
这是用来过滤掉任何重复值的经典查询。
为了有效地选择所有重复值的记录,我可以建议使用COUNT()窗口功能:
;with a as (
select ID, EmpFirstName, EmpLastName,
ROW_NUMBER() OVER (PARTITION BY EmpFirstName, EmpLastName ORDER BY ID) AS RowNum,
COUNT(*) OVER (PARTITION BY EmpFirstName, EmpLastName) AS cnt
FROM aTable
)
SELECT * FROM a where cnt > 1
ORDER BY EmpFirstName, EmpLastName
为了测试它使用此查询:
drop table #tmp
CREATE table #tmp (ID int , EmpFirstName varchar(10) , EmpLastName varchar(10))
go
INSERT INTO #tmp VALUES
(1,'X','Y')
,(2,'A','B')
,(3,'A','B')
,(4,'A','C')
,(5,'B','C')
,(6,'B','C')
;with a as (
select ID, EmpFirstName, EmpLastName,
ROW_NUMBER() OVER (PARTITION BY EmpFirstName, EmpLastName ORDER BY ID) AS RowNum,
COUNT(id) OVER (PARTITION BY EmpFirstName, EmpLastName) AS cnt
FROM #tmp
)
SELECT * FROM a where cnt > 1
ORDER BY EmpFirstName, EmpLastName
结果:
ID EmpFirstName EmpLastName RowNum cnt
----------- ------------ ----------- -------------------- -----------
2 A B 1 2
3 A B 2 2
5 B C 1 2
6 B C 2 2
我喜欢逻辑'COUNT(*)OVER(PARTITION BY EmpFirstName,EmpLastName)AS cnt',但它没有工作..它在计数结束EmpFirstName而不考虑姓氏:( –
适用于我:'drop table #tmp CREATE table #tmp(ID int,EmpFirstName varchar(10),EmpLastName varchar(10)) go INSERT INTO #tmp VALUE (1,'X','Y') ,(2,'A',' B') ,(3,'A','B') ,(4,'A','C') ,(5,'B','C') ,(6''B' ,'C') ; with a( select ID,EmpFirstName,EmpLastName, ROW_NUMBER()OVER(PARTITION BY EmpFirstName,Emp (*)OVER(PARTITION BY EmpFirstName,EmpLastName)AS cnt FROM #tmp ) )SELECT * FROM a where cnt> 1' – cha
好吧,我想我觉得为什么它似乎你这是由EmpFirstName计数,这是因为你的结果集是未排序的。将'ORDER BY EmpFirstName,EmpLastName'添加到查询的末尾,您将得到正确的结果 – cha
我制作样本数据并使用此查询
CREATE table #tmp (ID int , EmpFirstName varchar(10) , EmpLastName varchar(10) ,RowNum int)
INSERT INTO #tmp VALUES
(1,'X','Y',1)
,(2,'A','B',1)
,(3,'A','B',2)
SELECT ID,EmpFirstName,EmpLastName,RowNum
FROM (
SELECT *
,ROW_NUMBER() OVER (ORDER BY ID) AS [NEWrownum]
FROM #tmp
) q
WHERE q.NEWrownum > 1
试试这个,
DECLARE @Result TABLE (ID INT, EmpFirstName VARCHAR(10), EmpLastName VARCHAR(10), RowNum INT)
INSERT INTO @Result
VALUES
(1, 'X', 'Y', 1)
,(2, 'A', 'B', 1)
,(3, 'A', 'B', 2)
SELECT r1.*
FROM @Result r1
INNER JOIN (SELECT * -- get duplicate records
FROM @Result
WHERE RowNum = 2
) as r2 ON r1.EmpFirstName = r2.EmpFirstName
AND r1.EmpLastName = r2.EmpLastName
如果第二条记录有'RowNum' ='1',那么为什么你要在你的结果集?这听起来与我矛盾。 –
其实@TimBiegeleisen如果设置有任何重复的记录,那么我需要完整的记录信息。原始数据集中有很多字段,显然重复将被删除,但是要做出决定,两个记录都需要输出。如果我选择'RowNum = 2',那么决定是否删除第2条记录或第1条记录。 –
我看到重复的第一行和第二行,但是它们的'RowNum'值仍然小于1.为什么包含它们? –