2013-04-28 92 views
1

我了解到Pig是建立在Apache Hadoop之上的。但是我无法找到Pig所具有的缺乏Hadoop实现的额外功能。什么导致了对猪拉丁语这样的语言的需求? Hadoop缺乏什么?Apache Pig和Hadoop的实现

回答

2

从维基报价:

猪是创建与 这个平台Hadoop.The语言被称为猪拉丁使用MapReduce程序一个高层次的平台。猪拉丁 抽象从Java的MapReduce成语编程成 符号,这使得MapReduce编程水平高,类似于SQL的那 的RDBMS系统。 Pig Latin可以使用UDF(用户定义的函数)进行扩展,用户可以使用Java,Python或JavaScript编写,然后直接从该语言中调用。现在

,关键字以上是高层摘要。我们的DBA可以创建/管理数据库,而无需掌握任何主要编程语言知识,但可以使用SQL,同样,我们可以让数据工程师使用Pig创建/管理数据管道/仓库,而不必深入了解如何/正在进行的复杂工作作为hadoop作业执行/执行。 因此,为了回答您的问题,Pig并不是Hadoop的补充,但它只是一个构建在hadoop之上的高级框架,可以更快地完成任务(开发时间)。

你当然可以做的一切是什么猪用Hadoop做,但尝试了猪的一些高级功能,并为他们编写Hadoop作业需要一段很美好的时光。因此,非常自由地说,在数据工程中通用/通用的一些任务已经以Pig的形式在裸手hadoop中实现,您只需要以Pig-Latin的形式告诉它即可执行。

+1

不完全是关系到你的问题,但这篇文章是一个很好看的:http://developer.yahoo.com/blogs/hadoop/posts/2010/01/comparing_pig_latin_and_sql_fo/ – Amar 2013-04-28 06:24:16