我们旨在利用PIG进行服务器日志的大规模日志分析。我需要从一个文件加载一个PIG映射数据类型。PIG加载CSV - 地图类型错误
我试着用下面的数据运行一个示例PIG脚本。
在我的CSV文件中的行,名为 '测试'(由PIG处理)的样子,
151364,[ref#R813,highway#secondary]
我的PIG脚本
a = LOAD 'test' using PigStorage(',') AS (id:INT, m:MAP[]);
DUMP a;
的想法是加载一个int和第二个元素作为散列表。 但是,当我转储时,int字段得到正确解析(并在转储中打印),但未解析映射字段导致解析错误。
有人能解释一下,如果我错过了什么吗?