pdi

    2热度

    4回答

    我想从Java运行一个涉及数据库(任何数据库,但noSQL更优选)的PDI转换。 我尝试过使用mongodb和cassandradb并且缺少插件,我已经在这里询问:Running PDI Kettle on Java - Mongodb Step Missing Plugins,但没有人回复。 我试过使用PostgreSQL切换到SQL DB,但它仍然无法正常工作。从我做的研究来看,我认为这是因为

    0热度

    1回答

    我的源具有不同的日期格式,如下所示,并寻找一种算法来识别在Pentaho数据与选择值和模糊步骤集成中尝试的源日期模式。 日期列(串) “20150210” “20050822--” “2014-02-五月” “20051509--” “02月2014年” “2013 -MAY-12" “12DEC2013”​​ “15050815” “五月-02-2014” “12312015” 我知道,在PDI

    6热度

    4回答

    场景: 我已经创建的转换将数据从csv文件加载到表,我在csv文件下列: CUSTOMER_ID COMPANY_ID Employee_Name 但用户可能会与输入文件列顺序(随机顺序) Employee_Name COMPANY_ID CUSTOMER_ID 所以,如果我尝试加载具有随机列顺序文件,将水壶负载正确的列值按列名...?

    0热度

    1回答

    我使用Pentaho v5.2。当我试图连接到SQL服务器我结束与下面的错误。我已经下载并放置了所需的驱动程序sqljdbc4-2.0 jar in pdi-ce-5.2.0.0-209\data-integration\lib。请帮助我,因为我是Pentaho的新手。 Error connecting to database [mssqlserverconn] : org.pentaho.di.

    1热度

    3回答

    我试图使用Analytik Query步骤来访问前一行的某个计算字段。原来,所有的行都是并行计算的,访问前一行的字段会给出它们在处理过程中的当前值,这是随机的。似乎不可能获得前一行字段的值。或者除了Analytik Query步骤还有其他方法吗?我想我需要的是一个复选框“等待以前的行完成”... 我需要这个:我是处理时间依赖数据和做状态识别。当我目前处于状态A时,我使用数据做其他事情,然后处于状态

    1热度

    1回答

    我在工作中使用Pentaho数据集成进行众多项目。我们主要使用Postgres来处理我们的数据库。我们的一个较旧的表格有两列设置为键入位(1)以将0存储为false,将1存储为true。 我的任务是在开发环境中将生产表与副本进行同步。我正在使用表格输入读取数据,并立即尝试执行插入/更新。但是,由于通过PDI转换为布尔值,它失败了。我更新了查询以将值转换为整数来保留0和1,但是当我再次运行它时,我的

    0热度

    2回答

    系统细节: Windows 7 Professional Processor :Intel Core i3 RAM: 3GB System Type : 32 Bit Operating System. PDI版本: pdi-ce-6.0.0.0-353 步骤来进行: 1. Extracted the Zip File pdi-ce-6.0.0.0-353.zip into G:\

    0热度

    2回答

    我正在使用Pentaho数据集成创建从xlsx文件到mysql的转换,但我无法从Excel 2007 xlsx(apache POI Straiming)的大文件导入数据。它给了我内存不足的错误。

    0热度

    1回答

    我试图将Pentaho连接到Hive,以便我可以通过Pentaho运行Hive查询。 我在Windows 7(Professional 64bit)上安装了Pentaho 6.0。 我在“裸机服务器”上配置了Hadoop。是Hadoop的系统的细节如下: 的Apache Hadoop的V 2.6 蜂房1.1版 YARN 我尝试连接到的Pentaho通过使用连接类型:Hadoop的蜂房2,数据库名称

    1热度

    1回答

    我只是想知道为什么Pentaho PDI有许多名称,如勺子,水壶和Pentaho PDI这个工具的真名是什么? (我正在讨论从某些数据源提取数据并修改并迁移到另一个位置的工具)