Dataframe:
one two
a 1 x
b 1 y
c 2 y
d 2 z
e 3 z
grp = DataFrame.groupby('one')
grp.agg(lambda x: ???) #or equivalent function
所需的输出从grp.agg:蟒蛇大熊猫定制AGG功能
one two
1 x|y
2 y|z
3 z
我的积分dataframes前AGG功能是"|".join(sorted(set(x)))
。理想情况下,我希望组中有任意数量的列,并且为上述两个列项目返回"|".join(sorted(set())
。我也试过np.char.join()
。
爱熊猫,它已经把我从800线复杂的程序,到400线在公园放大。谢谢:)
太棒了。我正在骇人听闻的'grp2.agg(lambda x:u“|”.join(sorted(set(map(str,x.tolist())))))'。感谢您向我展示使用阵列的真实性!哪里有很好的参考?再次感谢。 –
老实说,Ipython和代码片段的试验比我的理解做得比任何一个资源都多。但是Wes McKinney的Python for Data Analysis是一个很好的参考。 – Zelazny7
自12月以来,我一直在阅读这本书,但仍有很多需要练习。仅供参考我看了一些HDF5商店的问题,我遇到了同样的灵活性问题。我使用了300万行数据集,包含60列,大量文本,并且MongoDB一直是冠军。 –