我有以下结构的pandas.DataFrame
:GROUPBY并降低与numpy的阵列熊猫dataframes作为条目
>>> data
a b values
1 0 [1, 2, 3, 4]
2 0 [3, 4, 5, 6]
1 1 [1, 3, 7, 9]
2 1 [2, 4, 6, 8]
('values'
具有numpy.array
类型)。我想要做的是按列'a'
对数据进行分组,然后合并值列表。 我的目标是与以下落得:
>>> data
a values
1 [1, 2, 3, 4, 1, 3, 7, 9]
2 [3, 4, 5, 6, 2, 4, 6, 8]
注意,该值的顺序并不问题。我如何实现这一目标?我虽然关于像
>>> grps = data.groupby(['a'])
>>> grps['values'].agg(np.concatenate)
但这失败了KeyError
。我确信有一种可以实现这个目标的手段 - 但是如何? 谢谢。
我该如何实现,即所得的列仍然具有“值”的名称? – rammelmueller
@rammelmuller你想对a和b做什么?算了吧? –
''b''默认被丢弃,''a''应该保持并且被称为相同。 – rammelmueller