apache-pig

    0热度

    1回答

    我有下面的单个原始文件,并且需要将文件拆分成不同的关系。 如果线的起点为0,完整的行应转到关系“标题” 如果行开头1,完整的行应转到关系“禁止” 如果行开头2,完整的行应转到关系“子” 如果符合3开始,完整的行应转到关系“项目” 如果符合4开始,完整的行应转到关系“税” 0ALH 012012050104.00.00356.0012.06001 1980377362 HAW R 1200100

    1热度

    1回答

    我正在尝试编写一个过滤器UDF,它将输入作为元组,并返回元组,但是当我在Gruntt shell中定义函数时,我得到错误消息解析失败,我在哪里做错了这里 REGISTER /home/filterUDF.jar; DEFINE filDist 'FilterDistrictUdf/FilterDistrict' package FilterDistrictUdf; import ja

    0热度

    1回答

    这是一个基本的PIG问题。 我有我的数据是这样的 10 | Dog 15 | Cow 20 | Dog 15 | Elephant 15 | Dog 25 | Elephant 我想要找的平均重量每只动物的,并具有输出,因为这: Dog | 12.5 Elephant | 20 Cow | 15 我能够通过使用GROUP和得到的结果,但结果是一个袋子,像这样: {(Dog),

    0热度

    1回答

    我有以下方式的一些数据: (102,(727,103,895)) (102,(105,255)) 有谁知道如何在猪这些数据转换为下面的方式? (102,727) (102,103) (102,895) (102,105) (102,255)

    0热度

    2回答

    我想在猪中执行以下命令 7369,SMITH,CLERK,800.00,null,20 7499,ALLEN,SALESMAN,1600.00,300.00,30 脚本 emp_bag = LOAD '/home/training/dvs/emp.csv' using PigStorage(',') AS (eno:int, ename:chararray, job:chararray, s

    0热度

    1回答

    可以说:我有一个与蜂巢结构相关的表。我可以通过这个表格数据创建一个猪模式吗?将蜂房查询和猪模式 - 两者都可行吗?

    1热度

    1回答

    那么我如何从下列输入中获取猪的这个输出。该命令我应该使用 输入: 10/3/2013 1200 10/4/2013 0000 预期输出: Monday Morning Tuesday Evening

    0热度

    1回答

    运行猪脚本时出现错误2017-10-29 03:34:22,212 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 6, column 13> Syntax error, unexpected symbol at or near ''/home/harsh/Hunny/HadoopPractice/Pig/Uppe

    0热度

    2回答

    我是Hadoop和pig的新手。根据问题我能够深入研究,直到下面的脚本,但我怎么能比较个人的薪水与他的部门的平均工资。以下是写入得到各部门的平均工资脚本 A = LOAD 'Assignment_1_Input.log' USING PigStorage('\t') as (id:int,name:chararray,age:int,salary:int,deptid:int); B = GRO

    -2热度

    1回答

    猪的SQL等级select * from表名