我是新来的Apache猪和尝试加载测试Twitter的数据由每一个用户名,找出鸣叫的次数将数据加载到猪。下面是一个使用PigStorage作为我的数据如何使用不同的PigStorage操作
format(twitterId,comment,userRefId):
当我试图将数据加载到猪(”‘),它也分我的评论区分为多个字段,因为评论也可以有’, ”。请让我知道如何在Pig中正确加载这些数据。我使用下面的命令:
data = LOAD '/home/vinita/Desktop/Material/PIG/test.csv' using PigStorage(',') AS (id:chararray,comment:chararray,refId:chararray);
是否修改源数据使用不同的分离器的选项? – darkownage
@darkownage:是 –