我有很多gzip'd日志文件在s3中有3种类型的日志行:b,c,i。我和c都是单级json:如何解析Pig中的JSON?
{"this":"that","test":"4"}
b类型是深深嵌套的json。我碰到这个gist谈论编译一个罐子,使这项工作。由于我的Java技能不如恒星,我不知道从这里做什么。
{"this":{"foo":"bar","baz":{"test":"me"},"total":"5"}}
由于I型和C并不总是以相同的顺序,这使得指定一切都在生成正则表达式困难。是否可以使用Pig处理JSON(在gzip文件中)?我使用任何版本的Pig都是基于Amazon Elastic Map Reduce实例构建的。
这可归结为两个问题: 1)我可以用Pig解析JSON吗?如果是,如何? 2)如果我可以解析JSON(从gzip'd日志文件),我可以解析嵌套的JSON对象吗?
链接上的“建立数据库连接时出错” – andreban 2013-08-07 23:27:16