在猪脚本中,我想找到一种方法来转义我的数据中的分隔符,这样它就不会被解释为额外的列。例如,如果我使用冒号作为分隔符,并且我有一个值为“foo:bar”的列,我希望该字符串解释为单个列,而不需要加载器在中间拾取逗号。如何摆脱价值中发现的分隔符 - 猪脚本?
1
A
回答
0
您可以尝试http://pig.apache.org/docs/r0.12.0/func.html#regex-extract-all
正则表达式可能需要进行调整。
0
看起来,Pig把Input作为字符串,它不那么聪明以便确定数据是什么或不是什么。
猪存储在强Tokenizer上工作。所以,如果ü要像做
a = LOAD '/abc/def/file.txt' USING PigStorage(':');
它不会似乎是解决你的问题。但是如果我们可以编写我们自己的PigStorage()方法,我们可能会遇到一些解决方案。
我会尝试发布代码来解决这个问题。
0
你可以使用STRSPLIT(string,regex,limit);用于基于分隔符的列拆分。
相关问题
- 1. 如何摆脱jscroll分隔符?
- 2. 摆脱了分隔符
- 3. Response.Write - 我现在如何摆脱脚本?
- 4. 如何摆脱谷歌偏好脚本?
- 5. 在猪脚本
- 6. 如何摆脱java中逗号分隔字符串中的重复项?
- 7. 桑达发现自己和摆脱脚本结果
- 8. NSTableView摆脱空白分隔列
- 9. 如何在matlab分析股票价格中摆脱Nans?
- 10. 猪脚本STRSPLIT
- 11. 如何摆脱HTML中的换行符
- 12. 如何摆脱列中的冗余值?
- 13. 如何猪脚本
- 14. 如何摆脱sas中的字符
- 15. 如何摆脱vim中的^ I符号?
- 16. 如何摆脱字典中的None值?
- 17. 摆脱样本数据中的峰值
- 18. 如何摆脱swagger的“价值”json {“value”:“{\”swagger \“:\”2.0 \“,\”info \“{\”description?
- 19. 如何在另一个猪脚本中调用猪脚本
- 20. 如何摆脱PHP脚本输出中的'Content-type:text/html'?
- 21. 猪脚本从
- 22. 摆脱python + selenium脚本的冗长
- 23. htaccess如何摆脱可选的最后目录列表分隔符?
- 24. 如何摆脱ReportViewer控件呈现的RDLC中的双页分页符?
- 25. UITableView - 摆脱分隔符(不只是使它们清晰)
- 26. 匹配逃脱分隔符
- 27. 如何按分隔符分隔值?
- 28. VisualStudio中 - 如何摆脱这种字符
- 29. 如何摆脱Python中列值的$符号
- 30. 如何摆脱Java中的数组字符串的空值?
感谢Fred,但我的输入是关键和值的文本文件。 –
你能张贴几行你的输入作为例子吗? – Frederic
联系人姓名:dusre:rage是文本,我需要dusre:rage作为关键联系人姓名的值,但截至目前它只给出dusre作为值。 –