我想将hadoop整合到pentaho数据集成中,我在pentaho网站上发现,在那个网站中有hadoop的pentaho,但它是商业的。我想让我的数据集成社区成为整合与hadoop。 我该如何解决这个问题?将pentaho社区与hadoop集成
韩国社交协会
我想将hadoop整合到pentaho数据集成中,我在pentaho网站上发现,在那个网站中有hadoop的pentaho,但它是商业的。我想让我的数据集成社区成为整合与hadoop。 我该如何解决这个问题?将pentaho社区与hadoop集成
韩国社交协会
在新版本(PDI 4.2.0),你可以看到的Hadoop组件在PDI。
,请访问:http://sourceforge.net/projects/pentaho/files/Data%20Integration/
其实因为PDI 4.3.0(这得到了昨日发布)的开源版本现在已经囊括了所有的Hadoop的东西!所以,直接进入sourceforge并下载!所有文档都在infocenter.pentaho.com
将Kettle(ETL)与Hadoop及其他各种NoSQL数据存储集成的最新工作可在Pentaho Big Data Plugin中找到。这是一个Kettle插件,并提供连接HDFS,MapReduce,HBase,Cassandra,MongoDB,CouchDB的许多Pentaho产品:Pentaho数据集成,Pentaho报告和Pentaho BA服务器。该代码托管在Github上:https://github.com/pentaho/big-data-plugin。
有一个社区登陆页面,提供关于Pentaho Wiki的更多信息。您将在这里找到如何为Java开发人员指导,配置选项和文档:http://community.pentaho.com/bigdata