2
event1 foo_id1
event1 foo_id2
event1 foo_id4
event1 foo_id6
event1 foo_id7
event1 foo_id8
event1 foo_id8
event1 foo_id1
event1 foo_id4
event2 foo_id1
event2 foo_id2
event2 foo_id3
event2 foo_id4
event2 foo_id5
event2 foo_id6
event2 foo_id8
event2 foo_id9
event2 foo_id11
以上信息在某个存储桶(如s3://hadoop.mycompany.com/bucket1/foo1.txt
)下可用作S3中的文件。如何根据同一文件中的输入解析出现
所有事件都有foo_ids
。对于“event2
”中的所有事件,我想知道这些foo_id
(s)在event1
中发生了多少次。
例如在上述情况下,
foo_id1=2
foo_id2=1
foo_id3=0
foo_id4=2
foo_id5=0
foo_id6=1
foo_id8=2
foo_id9=0
foo_id11=0
如何编写配置单元脚本以预期的格式返回数据?