Python的大熊猫：获取多个行的指数，这列匹配一定值

给定一个DataFrame与列xk和yk，我们想找到DataFrame的指标，其中，用于xk和yk ==0值。Python的大熊猫：获取多个行的指数，这列匹配一定值

我有工作完美罚款只是一个列，但我不能让它工作都

b = (df[df['xk'] ==0]).index.tolist()

我会怎么做它xk和yk在同一时间。

来源

2016-08-02 WGP

我想你可以检查是否所有值都True相比集['xk', 'yk']通过all：

b = df[(df[['xk', 'yk']] == 0).all(1)].index.tolist()

另一种解决方案是增加第二个条件与&：

b = (df[(df['xk'] == 0) & (df['yk'] == 0)].index.tolist())

样品：

df = pd.DataFrame({'xk':[0,2,3], 
        'yk':[0,5,0], 
        'aa':[0,1,0]}) 

print (df) 
    aa xk yk 
0 0 0 0 
1 1 2 5 
2 0 3 0 

b = df[(df[['xk', 'yk']] == 0).all(1)].index.tolist() 
print (b) 
[0] 

b1 = (df[(df['xk'] == 0) & (df['yk'] == 0)].index.tolist()) 
print (b1) 
[0]

第二种解决方案是更快：

#length of df = 3k 
df = pd.concat([df]*1000).reset_index(drop=True) 

In [294]: %timeit df[(df[['xk', 'yk']] == 0).all(1)].index.tolist() 
1000 loops, best of 3: 1.21 ms per loop 

In [295]: %timeit (df[(df['xk'] == 0) & (df['yk'] == 0)].index.tolist()) 
1000 loops, best of 3: 828 µs per loop

来源

2016-08-02 14:04:53 jezrael

谢谢，非常完美，约，如果我想返回特定行的只是指数，而不是返回所有索引列表的 – WGP

什么我不知道，如果知道。如果使用'df = pd.DataFrame（{'xk'：[0,2,0]， 'yk'：[0,5,0]， 'aa'：[0,1,0]}）打印（df）'然后你得到DataFrame - 'a =（df.ix [（df ['xk'] == 0）＆（df ['yk'] == 0）]）''。你需要返回第一指数或第二指数值按位置？ – jezrael

Python的大熊猫：获取多个行的指数，这列匹配一定值

回答

相关问题