1
我正在与Apache猪和Mahout工作。现在我正在研究apache mahout的频繁模式增长。我在下面的格式有数据如何从组转换成阿帕奇猪集
user items
1 i1
1 i2
1 i3
2 i2
2 i5
2 i6
3 i1
3 i4
--load数据
data = LOAD '$input' AS (user,item);
然后,我通过用户
grpdata = GROUP data BY user;
分组我的数据,我得到
1 {(1,i1),(1,i2),(1,i3)}
2 {(2,i2),(2,i5),(2,i6)}
3 {(3,i1),(3,i4)}
这是我的问题,我如何改变t他包创建为分组到以下格式的结果
1 i1,i2,i3
2 i2,i5,i6
3 i1,i4
感谢。这对我帮助很大。 – user2950865