2012-04-17 41 views
1

我有一个标准化表。我想从该表的一个特定列中选择所有值,并将该列中的唯一值加载到单独的表中。如何使用pentaho壶从一组行中找到唯一值?

如何做到这一点使用Pentaho的勺子?请注意,我是勺子的新手。在我的人生中,我只尝试过你好世界的转变。

我已经表命名为“员工”,这有很多的列如下(我没有给无关这里列):

+-------------------------------------------------------+ 

          Employees 
+-------------------------------------------------------+ 

employee_number | employee_name | deputed_branch | phone 

+-------------------------------------------------------+ 

现在我只想独特的分支名称进入使用名为branches新表勺。

'分支' 表将类似于以下内容:

+-------------------------------------------------------+ 

          branches 
+-------------------------------------------------------+ 

| branch_id | branch_name 

+-------------------------------------------------------+ 

其中branch_id将是独一无二的,自动递增。

要连接Employeesbranches表,我将使用Employee_branch表,该表将包括employee_numberbranch_id列。

谁能告诉如何做到这一点?

在此先感谢!

回答

3

你就不能这样做,在SQL?

选择员工

如果没有明显的deputed_branch;然后使用唯一行步骤(并非它必须是已排序的数据)或逐组。 (也排序)

或;如果行数很少,则按内存分组排序(数据不需要排序)