我一直在研究一个包含配置单元查询的项目。Hive断开管道错误
INSERT INTO OVERWRITE .... TRANSFORM(....)USING '蟒script.py' FROM ....左外连接。 。 。左外连接。 。 。 LEFT OUTER JOIN
开始时一切正常,直到我们加载了大量的虚拟数据。我们只是在一些字段上写下相同的记录,而且变化很小。之后,我们再次运行这个程序,我们得到一个断开的管道错误,没有太多的信息。没有关于错误的日志,只是IOException:断开的管道错误。 。 。 。
为了简化脚本和隔离错误,我们修改脚本以
for line in sys.stdin.readlines():
print line
,以避免任何错误在该水平。我们仍然有同样的错误。