apache-pig

0热度

1回答

我有下面的单个原始文件，并且需要将文件拆分成不同的关系。如果线的起点为0，完整的行应转到关系“标题” 如果行开头1，完整的行应转到关系“禁止” 如果行开头2，完整的行应转到关系“子” 如果符合3开始，完整的行应转到关系“项目” 如果符合4开始，完整的行应转到关系“税” 0ALH 012012050104.00.00356.0012.06001 1980377362 HAW R 1200100

1热度

1回答

猪错误：解析查询失败

我正在尝试编写一个过滤器UDF，它将输入作为元组，并返回元组，但是当我在Gruntt shell中定义函数时，我得到错误消息解析失败，我在哪里做错了这里 REGISTER /home/filterUDF.jar; DEFINE filDist 'FilterDistrictUdf/FilterDistrict' package FilterDistrictUdf; import ja

0热度

1回答

PIG集团避免袋

这是一个基本的PIG问题。我有我的数据是这样的 10 | Dog 15 | Cow 20 | Dog 15 | Elephant 15 | Dog 25 | Elephant 我想要找的平均重量每只动物的，并具有输出，因为这： Dog | 12.5 Elephant | 20 Cow | 15 我能够通过使用GROUP和得到的结果，但结果是一个袋子，像这样： {(Dog),

0热度

1回答

变换具有多个字段的数据在猪

我有以下方式的一些数据： (102,(727,103,895)) (102,(105,255)) 有谁知道如何在猪这些数据转换为下面的方式？ (102,727) (102,103) (102,895) (102,105) (102,255)

0热度

2回答

庆典：靠近意外的标记'（”语法错误 - 猪，CentOS的

我想在猪中执行以下命令 7369,SMITH,CLERK,800.00,null,20 7499,ALLEN,SALESMAN,1600.00,300.00,30 脚本 emp_bag = LOAD '/home/training/dvs/emp.csv' using PigStorage(',') AS (eno:int, ename:chararray, job:chararray, s

0热度

1回答

蜂房和猪在相同的数据集上

可以说：我有一个与蜂巢结构相关的表。我可以通过这个表格数据创建一个猪模式吗？将蜂房查询和猪模式 - 两者都可行吗？

1热度

1回答

将日期转换为星期名称和当天的部分时间

那么我如何从下列输入中获取猪的这个输出。该命令我应该使用输入： 10/3/2013 1200 10/4/2013 0000 预期输出： Monday Morning Tuesday Evening

0热度

1回答

在猪中使用UDF时出现错误1070

运行猪脚本时出现错误2017-10-29 03:34:22,212 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 6, column 13> Syntax error, unexpected symbol at or near ''/home/harsh/Hunny/HadoopPractice/Pig/Uppe

0热度

2回答

如何获得薪水高于其部门平均水平的员工的姓名和部门？

我是Hadoop和pig的新手。根据问题我能够深入研究，直到下面的脚本，但我怎么能比较个人的薪水与他的部门的平均工资。以下是写入得到各部门的平均工资脚本 A = LOAD 'Assignment_1_Input.log' USING PigStorage('\t') as (id:int,name:chararray,age:int,salary:int,deptid:int); B = GRO

-2热度

1回答

猪的SQL等级select * from表名