2016-12-22 54 views
0

在我的S3存储桶中,我有.xls文件(这个文件是分组文件,我的意思是前20行有一些图像和一些关于客户端的细节)。如何使用复制命令从amazon s3桶excel文件加载redshift表?

因此,首先我想将.xls转换为.csv,然后通过复制命令加载Redshift表,并忽略前20行。

注:我manualy为.xls的保存到的.csv然后我试图通过拷贝命令加载红移 表加载成功。现在我的问题是 如何通过Pentaho作业将.xls转换为.csv。

+0

欢迎堆栈溢出!您能否编辑您的问题以提供更多信息来解释您正在努力实现的目标?例如,数据如何生成,它如何进入Amazon S3,您目前是否可以调用任何Amazon Redshift COPY命令?你尝试了什么,你面临什么问题?这些文件是什么格式? Amazon Redshift只能加载分隔(例如CSV),固定宽度或JSON文件格式。 –

+0

@John谢谢,可以通过pentaho作业将.xls文件转换成.csv文件吗? – Velu

回答

0

您可以将Excel中通过转化只用两个步骤里面CSV:

  1. Microsoft Excel中输入 - 它应该从你的读取Excel行文件
  2. 文本文件输出 - 从第1步中保存行以csv文件

enter image description here

相关问题