我正在构建一个文件,使用SSMS
,它将作为机器学习程序的输入。输出文件将是SQL Server 2008 R2 Express
数据库中多个表的查询结果。用二进制列处理SQL Server中的缺失值
查询结果中的一些单元格的值为NULL
。目前,我在使用ISNULL()
函数在存在NULL
值时插入'0.00'
,但这只是一个临时度量,因为某些值实际上是'0.00'
,这会使计算偏斜。
会是什么样的原始数据,如:
id surveyResponseRate personResponseRate
001 .068 .15
002 0.00 NULL
003 .014 .03
004 NULL .20
005 .068 0.00
... ... ...
什么当前进程创建:
id surveyResponseRate personResponseRate
001 .068 .15
002 0.00 0.00
003 .014 .03
004 0.00 .20
005 .068 0.00
... ... ...
我很好奇,如果有要创建一个二进制列,它是0
如果该值的方式实际上0.00
和1
如果它实际上是0.00
由于NULL
值。
我想看到的:
id surveyResponseRate personResponseRate survRRNA perRRNA
001 .068 .15 0 0
002 0.00 0.00 0 1
003 .014 .03 0 0
004 0.00 .20 1 0
005 .068 0.00 0 0
... ... ... ... ...
如何做到这一点有什么建议?