我是PIG新手,对它不了解太多。如何解析PIG中的文本?要读取字段的值,猪中存在位置参数的概念,例如$ 0对应于第一个字段,类似地,是否有像可以读取整行的位置参数那样的任何特性。什么是RADOOP,在哪里可以使用它?使用PIG文本解析
回答
我不确定你在问什么。猪有许多功能,例如TOKENIZE和正则表达式匹配/提取UDF,这些都可能有帮助。当然,您也可以使用Java或Python编写任何您喜欢的文本处理代码,然后调用它。
我如何可以调用Java或Python代码猪 – 2012-01-30 08:59:52
我想你是不是需要标记整行,只要把整行作为一个字段,对不对?
然后,我想你可以使用PigStorage(“\ n”),使用“\ n”作为字段分隔符整行当作一个字段。
我认为你的“RADOOP”是指hadoop,对吧?作为第一步,你可以在本地模式下运行猪,这意味着你不需要安装hadoop。
我想访问特定的行假设10行我怎么会做,我问that.No我只能意味着RADOOP ... – 2012-01-30 08:34:11
你的问题表明您想拥有某种与您的数据交互模式,但这一数据的体积较大。
RADOOP为R和Hadoop的结合,它应该能够为您提供一个GUI通过一些R统计分析使用Hadoop规模加工来运行你的大数据。
与此同时,我建议您看看Google-Refine(http://code.google.com/p/google-refine/),您可以轻松下载并运行您的数据证据流程。
随着谷歌,瑞风,你可以轻松地分析你的数据,使用内置的文本,日期和数字功能。您还可以使用Jython进一步增强所需的功能。它可以处理大规模的数据采样并使用内置Facets调查其功能。
R也是用于数据的证据一个伟大的工具,具有良好的抽样等统计分析库。但其接口基于命令行,针对高级统计师和分析师,而不是针对普通用户。
- 1. 错误而解析PIG-XML
- 2. 使用lex解析文本
- 3. 使用Javascript解析文本
- 4. 使用jQuery解析文本
- 5. 使用RegEx解析文本?
- 6. 解析文本使用LINQ
- 7. 使用Linq解析文本文件使用Linq解析文本文件
- 8. 使用shell脚本解析文本
- 9. 使用C++解析文本文件
- 10. 使用Python解析文本文件
- 11. 使用java解析文本文件
- 12. 使用python解析文本文件
- 13. 使用autohotkey解析文本文件
- 14. 使用Python解析文本文件
- 15. 使用Java解析文本文件
- 16. 使用strtok()解析文本文件
- 17. 使用Jsoup解析文本文件
- 18. C:使用substr解析文本文件
- 19. 使用xslt解析文本文件
- 20. 解析文本
- 21. 解析文本
- 22. 解析文本
- 23. 解析使用Pig脚本生成的组的输出的Java程序
- 24. 如何使用PIG脚本
- 25. Json与Pig中的elephantbird解析
- 26. 如何解析Pig中的JSON?
- 27. 解析apache pig中的XML和HTML
- 28. Apache Pig Java UDF - import org.apache.pig.EvalFunc;无法解析
- 29. 如何使用Pig解析列中的JSON字符串
- 30. 使用Pig解析多个分隔符的数据
这是两个问题吗? – 2012-01-29 18:36:24
是的,它是逸岸三个问题 – 2012-01-30 08:26:17