2012-09-10 29 views
1

有没有人知道任何列出所有操作员的Apache猪文档(如group by,streaming等)以及PIG采取的相应操作,即操作员的MR作业类型/数量结果是?MR作业的猪文档

我特别感兴趣的是流媒体方面,它如何映射到MR作业。

回答

0

但是到目前为止还没有一个完整的清单,但我认为这是值得阅读以下文章/章节:

之上建立一个高级别数据流系统的map-reduce:猪八戒经验
(第4节。编译来的MapReduce)
http://infolab.stanford.edu/~olston/publications/vldb09.pdf

隐语:一个不那么外语用于数据处理
(第4.2章MapReduce的计划编制)
http://infolab.stanford.edu/~olston/publications/sigmod08.pdf

此外,您可以随时在脚本 上发出EXPLAINILLUSTRATE以查看幕后发生的情况。