当查询配置单元外部表时,Null
值显示为'\ N'。Sqoop导入空字符串
下面是sqoop导入脚本:
sqoop进口-libjars /usr/lib/sqoop/lib/tdgssconfig.jar,/usr/lib/sqoop/lib/terajdbc4.jar -Dmapred.job .queue.name = xxxxxx \ --connect jdbc:teradata://xxx.xx.xxx.xx/DATABASE=$db,LOGMECH=LDAP --connection-manager org.apache.sqoop.teradata.TeradataConnManager \ - -username $用户--password $ PWD --query “
选择COL1,COL2,COL3从$ db.xxx
其中\ $条件” \ --null-string'\ N'--null-non-string'\ N'\ - 字段终止由'\ t'--num-mappers 6 \ - 分割作业号\ --delete-目标目录\ --target-DIR $ hdfs_loc
请告知应该做哪些改变了脚本,以便当外部蜂巢查询表空值显示为空值。
用'--null-string'\ N''向我提供空 - 非字符串值作为“空”写入HDFS,但是你的指导原则使它工作:)它们被正确读取为空值。 –