2017-12-18 57 views
0

我想读取以逗号分隔(,)但在双引号("")内忽略逗号的csv文件。我想将结果存储到一个表中。使用逗号作为分隔符和psql中的转义引号读取csv文件

例子:

abc,00.000.00.00,00:00:00:00:00:00,Sun Nov 01 00:00:00 EST 0000,Sun Nov 01 00:00:00 EST 0000,"Apple, Inc.",abcd-0000abc-a,abcd-abcd-a0000-00 

这里,我并不想拆就苹果。

我知道python中存在csv阅读器,我可以在plpython中使用它,但考虑到数百万这样的字符串,这是很慢的!我想要一个纯粹的psql方法!

+0

Apple和psql?你在哪里和你在用什么? – jarlh

回答

1

以下是使用CSV格式读取带有外部表格的CSV文件的示例。

CREATE EXTERNAL TABLE ext_expenses (name text, 
date date, amount float4, category text, desc1 text) 
LOCATION ('gpfdist://etlhost-1:8081/*.txt', 
      'gpfdist://etlhost-2:8082/*.txt') 
FORMAT 'CSV' (DELIMITER ',') 
LOG ERRORS SEGMENT REJECT LIMIT 5; 

这也是从Greenplum文档中提取的。

http://gpdb.docs.pivotal.io/530/admin_guide/external/g-example-4-single-gpfdist-instance-with-error-logging.html

+0

谢谢你的工作! –

相关问题