请帮助建议。仅加载4个字段的2个字段 - Pig to Hive表
场景:使用Pig将数据从HDFS存储到Hive。
我有从mySQL中挖出的文件,它有4个字段Ord_Id, Cust_Id, Cust_name, Ord_date
。我喜欢将仅2个字段Ord_Id和Cust_Id存储到Hive。我怎么能这样做?请建议。
下面的代码不能执行:
pig -useHCatalog
orders = LOAD '<HDFS_file_path>' USAGE PigStorage(',') AS (Ord_Id:Int, Cust_Id:Int, Cust_name:chararray, Ord_date:chararray);
STORE orders INTO 'pig_demo.orders' USAGE org.apache.hive.hcatalog.pig.HCatStorer();
感谢。