我想修复一个csv文件。
某些数据行需要根据情侣条件被删除。
假设你有以下数据框:
熊猫数据帧行删除
-A ----乙-----Ç
000 --- 0 ----- 0
000 --- 1 --- --0
001 --- 0 ----- 1
011 --- 1 ----- 0
001 --- 1 ----- 1
如果两个或更多的行具有列A的共同点,我想保留列B设置为1的行。
生成的数据框应如下所示:
-A ---- -----乙Ç
000 --- 1 ----- 0
011 --- 1 ----- 0
001 --- 1 ----- 1
我试验过merges和drop_duplicates,但似乎无法得到我需要的结果。不能确定列B = 1的行将在B = 0的行之后。drop_duplicates的take_last参数看起来很有吸引力,但我认为它不适用于此。
任何意见将不胜感激。
谢谢。
不应该'DF1 = df.loc [df.b == 1]'给你你想要什么,或者你认为会有行,你有'A'和'B'的唯一值仍然是0? – EdChum
我也想保留行的值为A是唯一的,而B的值是0. – Zihs
本质上,我想从df = pd.DataFrame({'A':['000','000' ,'001','011','001','111'],'B':[0,1,1,1,0,0]})至df1 = pd.DataFrame({'A':[ '000','001','011','111'],'B':[1,1,1,0]}) – Zihs