2016-07-23 53 views
1

的所有行假设您拥有带MultiIndex的Panda DataFrame。您想要获取具有特定值的标签的所有行。你怎么做到这一点?熊猫MultiIndex获取标签值为

我首先想到的是一个布尔面具...

df[df.index.labels == 1].head()

但这不起作用。

谢谢!

+0

您可以将索引转换回列,然后过滤。它当然适用于一个索引。它应该与multiindex一起工作,但我不确定。 –

+2

显示您使用的数据帧。 – Merlin

+0

为什么downvote?这是否清楚地记录在某个地方?不清楚吗?它没有帮助吗?它会帮助我显然http://meta.stackoverflow.com/questions/252677/when-is-it-justifiable-to-downvote-a-question –

回答

2

您需要指定您使用的索引。在我的例子中,我采取了第二个指标(我的数据帧是是因为它是如此的大熊猫的多指标页):

s[s.index.labels[1]==1] 

实际上,你可以看到指数是如何构建的,如果你键入:

s.index 

所形成的结构是:

MultiIndex(levels=[['bar', 'baz', 'foo', 'qux'], [1, 2]], 
     labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]], 
     names=['first', 'second']) 

下面我有全码:

>>> import pandas as pd 
>>> import numpy as np 
>>> arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], 
...   [1, 2, 1, 2, 1, 2, 1, 2]] 
... 
>>> tuples = list(zip(*arrays)) 
>>> index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) 
>>> s = pd.Series(np.random.randn(8), index=index) 
>>> s[s.index.labels[1]==1] 
first second 
bar 2  -0.304029 
baz 2  -1.216370 
foo 2   1.401905 
qux 2  -0.411468 
dtype: float64 
1

我会用xs (cross-section)

In [11]: df = pd.DataFrame([[1, 2, 3], [3, 4, 5]], columns=list("ABC")).set_index(["A", "B"]) 

In [12]: df 
Out[12]: 
    C 
A B 
1 2 3 
3 4 5 

那么你可以采取那些具有A级等于1:

In [13]: df.xs(key=1, level="A") 
Out[13]: 
    C 
B 
2 3 

使用drop_level=False做的过滤器(不删除的A股指数):

In [14]: df.xs(key=1, level="A", drop_level=False) 
Out[14]: 
    C 
A B 
1 2 3 
0

替代解决方案:

In [62]: df = pd.DataFrame({'idx1': ['A','B','C'], 'idx2':[1,2,3], 'val': [30,10,20]}).set_index(['idx1','idx2']) 

In [63]: df 
Out[63]: 
      val 
idx1 idx2 
A 1  30 
B 2  10 
C 3  20 

In [64]: df[df.index.get_level_values('idx2') == 2] 
Out[64]: 
      val 
idx1 idx2 
B 2  10 

In [65]: df[df.index.get_level_values(1) == 2] 
Out[65]: 
      val 
idx1 idx2 
B 2  10