2016-12-29 36 views
0

在Pig中设置自定义TextInputFormat分隔符的正确语法是什么?我已经尝试了以下几种变体,但将其视为字符串值而不是回车换行符。如何在PIG中设置自定义分隔符

set textinputformat.record.delimiter '\r\n'; 

猪版本是0.12.0-cdh5.9.0和Hadoop版本是2.6.0-cdh5.9.0

回答

1

不理想,但解决方法:

创建一个属性文件一样myprops.properties包含下面一行:textinputformat.record.delimiter=\r\n

然后运行脚本,如:pig -P ~/myprops.properties -f path/to/pigscript.pig

它看起来像这样是在第四评论第四段提到一个已知的问题:PIG_4572

0

下面是语法

SET textinputformat.record.delimiter '<delimiter>'; 

这对我的作品

+0

因为它对待这并不与控制字符工作该值为一个字符串。 – Shawn

+0

@shawn你有没有找到解决方案? –