2014-11-03 60 views
1

我见过的,有是接受头控制参数猪CSVExcelStorage删除头

CSVExcelStorage(String delimiter, String multilineTreatmentStr, String eolTreatmentStr, String headerTreatmentStr) 

但是我还没有发现什么是“SKIP_INPUT_HEADER”价值不变的构造函数。

+0

?您可以在加载期间直接将此MACRO传递给构造函数。 – 2014-11-03 12:47:48

回答

2

我不知道为什么你要SKIP_INPUT_HEADER的恒定值,但如果你的目的是要去除负载时的标题,然后请你为什么要“SKIP_INPUT_HEADER”的恒定值,检查下面的例子

input.csv 
Name,Age,Location 
a,10,chennai 
b,20,banglore 

PigScript:(With SKIP_INPUT_HEADER) 
REGISTER '/tmp/piggybank.jar'; 
A = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER'); 
DUMP A; 

Output: 
(a,10,chennai) 
(b,20,banglore) 



PigScript:(Without SKIP_INPUT_HEADER) 
REGISTER '/tmp/piggybank.jar'; 
A = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX'); 
DUMP A; 

OutPut: 
(Name,Age,Location) 
(a,10,chennai) 
(b,20,banglore)