可以使用GROUPBY的组合和应用:
In [2]: df = pd.DataFrame({
'transID': range(8),
'Location': ['New York','Chicago','New York','New York','Atlanta','Los Angeles',
'Chicago','Atlanta'],
'Sales': np.random.randint(0,10000,8)}).set_index('transID')
In [3]: df
Out[3]:
Location Sales
transID
0 New York 1082
1 Chicago 1664
2 New York 692
3 New York 5669
4 Atlanta 7715
5 Los Angeles 987
6 Chicago 4085
7 Atlanta 2927
In [4]: df.groupby('Location').apply(lambda d: d.sort()).reset_index('Location',drop=True)
Out[4]:
Location Sales
transID
4 Atlanta 7715
7 Atlanta 2927
1 Chicago 1664
6 Chicago 4085
5 Los Angeles 987
0 New York 1082
2 New York 692
3 New York 5669
我在最后一行放置“位置”,因为groupby会将分组级别插入到第一个位置该指数。排序然后删除它们可以保留排序的顺序。
感谢。但是这会导致索引的破坏,在某些情况下我可能不喜欢索引,因此仍然更喜欢'reset_index()'...感谢您的回答。 – Blaszard
“破坏指数”是什么意思? – cyborg
这将破坏多指令。您可以在[docs](http://pandas.pydata.org/pandas-docs/stable/advanced.html)中的多索引示例之一上尝试此操作。我会发布代码,但它作为评论基本上是不可读的。 – Russ