1
import pandas as pd
df= pd.DataFrame({'date':[1,2,3,4,5,1,2,3,4,5,1,2,3,4,5],
'name':list('aaaaabbbbbccccc'),
'v1':[10,20,30,40,50,10,20,30,40,50,10,20,30,40,50],
'v2':[10,20,30,40,50,10,20,30,40,50,10,20,30,40,50],
'v3':[10,20,30,40,50,10,20,30,40,50,10,20,30,40,50]})
a= list(set(list(df.name)))
plus=[]
for i in a:
sep=df[df.name==i]
sep2=sep[(sep.v1>=10)&(sep.v2>=20)&(sep.v3<=40)]
plus.append(sep2)
result=pd.concat(plus)
print(result)
我知道这是不是一个很好的例子,无论如何,我怎样才能提取使用“GROUPBY”
我想通过名称分别处理数据。
它需要太长时间在一个大的数据
我如何可以提取使用“GROUPBY”数据?
即使功能是用来更好(def..apply ...)
df.groupby(['name'])(df['v1']>20)
... ????它不能工作...