2013-02-28 57 views
0

我需要创建一个查看特定模式中的所有表的异常报表,然后计算跨列和行,列出每个列中包含NULL值的条目数量。如何动态统计数据库模式中所有表和列中具有空值的所有行

如何在不使用游标的情况下完成此操作?

实施例:

People_Table有3列(姓名,CONTACT_NO)
Entity_Table具有5列(ID,姓名,地址,TEL_NO,FAX_NO)

我需要生成一个列出每个表和列名称的输出以及每个列中包含NULL值的记录数。

People_Table:NAME(4),姓氏(9),CONTACT_NO(120)
Entity_Table:ID(0),NAME(4),ADDRESS(90),TEL_NO(120),FAX_NO (100 )

请注意,输出可以是常规数据集格式,并且不需要看起来像条目的连接!我只是以这种方式列出来描述数据输出。

这是一个动态数据库,随着时间的推移而变化,在此阶段没有任何NULL条目的列在将来可能有一个NULL条目,所以我需要跟踪这个。到目前为止,我已经为这个解决方案做了其他的事情,这是我现在需要的最后一个。任何建议?

+0

这有什么错用游标? – Max 2013-02-28 14:45:45

回答

0
DECLARE @dbname VARCHAR(100) = 'dbname' 
DECLARE @schemaName VARCHAR(100) = 'schemaname' 
DECLARE @result TABLE ([NullValues] int,col VARCHAR(4000)) 

SELECT @dbname dbname 
     ,t.name tbl 
     ,c.name col 
INTO #Temp1 
FROM sys.columns c 
JOIN sys.tables t ON 
     t.object_id = c.object_id 
JOIN sys.schemas s ON 
     s.schema_id = t.schema_id 
WHERE c.is_nullable = 1 
AND  s.name in (@schemaName) 

DECLARE @sql NVARCHAR(MAX) = 
STUFF(
(
    SELECT 'UNION ALL SELECT Count(*) as [NullValues],''' + @dbname + '.' + @schemaName + '.' + tbl + '.' + col + ''' FROM ' + @dbname + '.' + @schemaName + '.' + tbl + ' WHERE ' + col + ' IS NULL ' 
    FROM #Temp1 
    FOR  XML PATH('') 
), 1, 10, ' ') 

INSERT @result 
EXEC(@sql) 

SELECT [NullValues], col 
INTO #Nulls 
FROM @result 
WHERE col IS NOT NULL AND [NullValues] > 0 

SELECT 
     [TABLE_CATALOG] + '.' + [TABLE_SCHEMA] + '.' + [TABLE_NAME] + '.' + [COLUMN_NAME] as SchemaTableColumn 
     ,[TABLE_CATALOG] as 'Database' 
     ,[TABLE_SCHEMA] as 'Schema' 
     ,[TABLE_NAME] as 'TableName' 
     ,[COLUMN_NAME] 
     ,[ORDINAL_POSITION] 
     ,[DATA_TYPE] 
INTO #Temp2 
    FROM [DW_LandingCR].[INFORMATION_SCHEMA].[COLUMNS] 
    WHERE 
    [TABLE_SCHEMA] = @schemaName 
    ORDER BY TABLE_SCHEMA,TABLE_NAME,ORDINAL_POSITION 

SELECT sc.name as [Schema],ta.name as [TableName],SUM(pa.rows) RowCnt 
INTO #Temp3 
FROM sys.tables ta 
INNER JOIN sys.partitions pa 
ON pa.OBJECT_ID = ta.OBJECT_ID 
INNER JOIN sys.schemas sc 
ON ta.schema_id = sc.schema_id 
WHERE ta.is_ms_shipped = 0 
AND pa.index_id IN (1,0) 
AND sc.name = @schemaName 
GROUP BY sc.name,ta.name 
ORDER BY sc.name,ta.name 

Select 
    tp2.*,tp3.RowCnt 
Into #Detail 
From 
    #Temp2 tp2 
    inner join #Temp3 tp3 on tp2.[Schema]=tp3.[Schema] and tp2.[TableName]=tp3.[TableName] 

Select 
    det.*, 
    n.[NullValues] 
From 
    #Nulls n 
    Inner Join #Detail det on det.SchemaTableColumn=n.col 
Order By 
    det.[Database], 
    det.[Schema], 
    det.TableName, 
    det.[ORDINAL_POSITION] 


Drop Table #Nulls 
Drop Table #Detail 
Drop Table #Temp1 
Drop Table #Temp2 
Drop Table #Temp3 
0

试试这个(使用游标虽然):

DECLARE @tbl sysname 
DECLARE @col sysname 
DECLARE @sql nvarchar(max) 
DECLARE @cnt INT 

CREATE TABLE #result 
(
    tbl sysname, 
    col sysname, 
    nulls int 
) 

DECLARE crs CURSOR FOR 
select t.name, c.name 
from sys.columns c 
join sys.tables t on c.object_id = t.object_id 

OPEN crs 

FETCH NEXT FROM crs INTO @tbl, @col 

WHILE @@FETCH_STATUS=0 
BEGIN 

    SET @sql = 'select @cntOUT=count(*) from '[email protected]+' where '[email protected]+' is null' 

    SET @cnt = 0 
    exec sp_executesql @sql, N'@cntOUT INT OUTPUT', @[email protected] OUTPUT 

    INSERT INTO #result (tbl, col, nulls) 
    VALUES (@tbl, @col, @cnt) 


    FETCH NEXT FROM crs INTO @tbl, @col 
END 

CLOSE crs 
DEALLOCATE crs 

SELECT * FROM #result 

DROP TABLE #result 
+0

感谢您的努力。由于性能方面的原因,我需要阻止使用游标,因为此脚本将被插入任何格式的数据库中,并且会返回相关的详细信息。非常快速的回应,这让我更加适应这个论坛。我现在要发布我的答案! – Domondios 2013-03-01 07:45:31

+0

哦,天哪,现在我必须花时间将代码格式化为论坛要求。当我有时间这样做时,我会在这里回答我的答案。我也可以发布我的整个存储过程,但需要版权,因为这是检查整个数据仓库数据库一致性的简单方法,对任何开发人员都有好处。此Proc用于数据仓库环境 – Domondios 2013-03-01 08:01:27

+0

因此,您找到了一种不使用游标的方法?好奇看到你的解决方案。 – Max 2013-03-01 13:34:16

相关问题