在Pig中设置自定义TextInputFormat分隔符的正确语法是什么?我已经尝试了以下几种变体,但将其视为字符串值而不是回车换行符。如何在PIG中设置自定义分隔符
set textinputformat.record.delimiter '\r\n';
猪版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0
在Pig中设置自定义TextInputFormat分隔符的正确语法是什么?我已经尝试了以下几种变体,但将其视为字符串值而不是回车换行符。如何在PIG中设置自定义分隔符
set textinputformat.record.delimiter '\r\n';
猪版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0
不理想,但解决方法:
创建一个属性文件一样myprops.properties
包含下面一行:textinputformat.record.delimiter=\r\n
然后运行脚本,如:pig -P ~/myprops.properties -f path/to/pigscript.pig
它看起来像这样是在第四评论第四段提到一个已知的问题:PIG_4572
下面是语法
SET textinputformat.record.delimiter '<delimiter>';
这对我的作品
因为它对待这并不与控制字符工作该值为一个字符串。 – Shawn
@shawn你有没有找到解决方案? –