pentaho-data-integration

1热度

1回答

使用：Pentaho数据集成5.4社区版。在documentation存在，让在工作层面澄清数据库事务声明：交易在工作从PDI（企业版）的5.0版本开始，你也可以启用与作业中的转换相同的功能。 “使作业数据库事务处理”选项位于作业设置对话框的“设置”选项卡中。但是，这只适用于PDI 企业版。我需要在Community Edition中使用此功能。我一直试图通过使用Transform

0热度

1回答

Pentaho DI - 如何使用“IN”查询的下一步中的前一步的“全部”结果

我从数据库A中的表A输入了一个数据库A，我想要加入数据库B中的另一个表B. 这是我两个选择：利用数据库加盟：从表中数据库中的每个输入，运行加入数据库查询B. 使用两个输入表（talbeA + tableB的），做合并加入密钥。因为我想避免在tableA和tableB中完整读取，所以选择了＃1。我的问题是：如何将前一步的所有结果用作“IN”查询？例如 select * from tab

0热度

2回答

奇怪的错误由电热水壶

生产只有在水壶5.4开发的简单移植。的TRAN从MSSQL中提取数据，并插入到另一个MSSQL而没有任何其他操作。我启用复选框“为插入使用批处理更新”。通常，它会成功运行任何错误消息。偶尔会出现此错误和它不能被重新运行TRAN被再现。这里的错误日志： 2016/09/18 08:00:36 - tb_dim_innchangelog.0 - SQL query : SELECT 201

1热度

1回答

Pentaho正则表达式评估

我尽我所能在PDI中的文件内容上做了一个正则表达式，但它给了我输出中的空值。 Regex在Regex评估步骤的测试正则表达式部分中完美工作，但在预览中没有显示相同的输出。这里的文件内容：我期待1：19：18.637s输出，但它是null。下面是示例代码。它不会在你的本地机器上工作，但它肯定会给你一个我想要实现的想法。下面是我想要的代码： <?xml version="1.0" encodin

0热度

1回答

Pentaho：-CSV文件输入

我对Pentaho DI非常新。我的要求： - 在我的CSV文件输入步骤中，我不想从浏览器中选择文件。我想通过变量或动态方式传递它。说吧。我有“下载”文件夹中的文件和每日文件名得到改变。因此，在CSV文件输入步骤中，如果我通过变量并在此变量中设置“下载”文件夹的文件名，那么每次我都不必手动浏览文件。我该怎么做到这一点？

0热度

1回答

数据类型和索引

当您使用TEXT数据类型时，是否存在用于插入，更新或删除数据的某种性能差异？我去here，发现这个：提示：使用空白填充类型时，和一些额外的CPU周期，从增加的存储空间有这三种类型之间没有性能差别，除了在存储到长度受限的列时检查长度。尽管字符（n）在其他一些数据库系统中具有很好的性能，但在PostgreSQL中不存在这样的优势 ;实际上字符（n）通常是三个中最慢的，因为它有额外的存储成本。在

1热度

2回答

如何处理Pentaho Kettle中的1到多个SQL（表格输入）

我有一个情况，在我有以下表格。雇员 - EMP_ID，EMP_NAME，emp_address Employee_assets - EMP_ID（FK），ASSET_ID，ASSET_NAME（1-许多为雇员） Employee_family_members - EMP_ID（FK），fm_name，fm_relationship（1-many雇员）现在，我有运行预定的水壶作业，该作业从批处

1热度

2回答

Pentaho ETL性能问题

我有一个Pentaho ETL作业/转换，它读取文本文件并将一些记录插入到MS SQL数据库表中。我每天执行它。完成最多需要10分钟。当其他人执行它时，问题就会发生：时间长达40分钟。所有的执行都发生在同一台机器上，具有相同的JRE版本。日志没有显示任何异常，只是更长的时间间隔。系统信息：视窗8企业64bits的 JRE 1.7_79 32位 Pentaho的5.3.0 MS SQL 2