我有一个文件test_file_1.txt
包含:含PigLatin - 将数据插入现有分区?
20140101,value1
20140102,value2
和文件test_file_2.txt
:
20140103,value3
20140104,value4
在HCatalog有一个表:
create table stage.partition_pk (value string)
Partitioned by(date string)
stored as orc;
这两个脚本的工作很好:
Sc RIPT 1:
LoadFile = LOAD 'test_file_2.txt' using PigStorage(',') AS (date : chararray, wartosc : chararray);
store LoadFile into 'stage.partition_pk' using org.apache.hcatalog.pig.HCatStorer();
脚本2:
LoadFile = LOAD 'test_file_2.txt' using PigStorage(',')
AS (date : chararray, wartosc : chararray);
store LoadFile into 'stage.partition_pk' using org.apache.hcatalog.pig.HCatStorer();
表partition_pk
包含四个分区 - 一切都如预期。
但让我们说,还有另一个文件包含应该插入到一个现有分区中的数据。 Pig无法写入包含数据的分区(或者我错过了某些内容?) 如何管理加载到现有分区(不是空的非分区表)? 您是否阅读分区,将其与新数据联合,删除分区(如何?)并将其作为新分区插入?
Thans为您的答案。你写道:_Basically,它看起来像如果你不想使用动态分区,那么0.13可能适合你。你只需要记住设置适当的属性。你的意思是哪个参数?哪个bug解决了我的问题?谢谢 –
我更新了我的答案,以包含适用于我的解决方法。 – user2370813
感谢你与其他分区。你有没有检查过这个分区是否会影响桌面?它是不是沉没了休息时间? –