pentaho-data-integration

    1热度

    1回答

    使用:Pentaho数据集成5.4社区版。 在documentation存在,让在工作层面澄清数据库事务声明: 交易在工作 从PDI(企业版)的5.0版本开始,你也可以 启用与 作业中的转换相同的功能。 “使作业数据库事务处理”选项位于 作业设置对话框的“设置”选项卡中。 但是,这只适用于PDI 企业版。我需要在Community Edition中使用此功能。 我一直试图通过使用Transform

    0热度

    1回答

    我从数据库A中的表A输入了一个数据库A,我想要加入数据库B中的另一个表B. 这是我两个选择: 利用数据库加盟:从表中数据库中的每个输入,运行 加入数据库查询B. 使用两个输入表(talbeA + tableB的),做合并加入密钥。 因为我想避免在tableA和tableB中完整读取,所以选择了#1。 我的问题是: 如何将前一步的所有结果用作“IN”查询? 例如 select * from tab

    0热度

    2回答

    生产只有在水壶5.4开发的简单移植。 的TRAN从MSSQL中提取数据,并插入到另一个MSSQL而没有任何其他操作。 我启用复选框“为插入使用批处理更新”。 通常,它会成功运行任何错误消息。 偶尔会出现此错误和它不能被重新运行TRAN被再现。 这里的错误日志: 2016/09/18 08:00:36 - tb_dim_innchangelog.0 - SQL query : SELECT 201

    1热度

    1回答

    我尽我所能在PDI中的文件内容上做了一个正则表达式,但它给了我输出中的空值。 Regex在Regex评估步骤的测试正则表达式部分中完美工作,但在预览中没有显示相同的输出。 这里的文件内容: 我期待1:19:18.637s输出,但它是null。 下面是示例代码。它不会在你的本地机器上工作,但它肯定会给你一个我想要实现的想法。下面是我想要的代码: <?xml version="1.0" encodin

    0热度

    1回答

    我对Pentaho DI非常新。 我的要求: - 在我的CSV文件输入步骤中,我不想从浏览器中选择文件。我想通过变量或动态方式传递它。 说吧。我有“下载”文件夹中的文件和每日文件名得到改变。 因此,在CSV文件输入步骤中,如果我通过变量并在此变量中设置“下载”文件夹的文件名,那么每次我都不必手动浏览文件。 我该怎么做到这一点?

    0热度

    1回答

    当您使用TEXT数据类型时,是否存在用于插入,更新或删除数据的某种性能差异? 我去here,发现这个: 提示:使用空白填充类型时,和 一些额外的CPU周期,从增加的存储空间有这三种类型之间没有性能差别,除了 在存储到长度受限的列时检查长度。尽管字符(n)在其他一些数据库系统中具有很好的性能,但在PostgreSQL中不存在这样的优势 ;实际上字符(n)通常是三个中最慢的,因为它有额外的存储成本。在

    1热度

    2回答

    我有一个情况,在我有以下表格。 雇员 - EMP_ID,EMP_NAME,emp_address Employee_assets - EMP_ID(FK),ASSET_ID,ASSET_NAME(1-许多为雇员) Employee_family_members - EMP_ID(FK) ,fm_name,fm_relationship(1-many雇员) 现在,我有运行预定的水壶作业,该作业从批处

    1热度

    2回答

    我有一个Pentaho ETL作业/转换,它读取文本文件并将一些记录插入到MS SQL数据库表中。 我每天执行它。完成最多需要10分钟。当其他人执行它时,问题就会发生:时间长达40分钟。 所有的执行都发生在同一台机器上,具有相同的JRE版本。 日志没有显示任何异常,只是更长的时间间隔。 系统信息: 视窗8企业64bits的 JRE 1.7_79 32位 Pentaho的5.3.0 MS SQL 2