2016-10-20 92 views
1

我是熊猫新手,并试图删除一些不必要的列,然后删除重复的记录。脚本的第一部分在删除列时起作用。但是,脚本没有执行任务的第二部分,因为剩余大量重复部分。任何帮助将不胜感激。熊猫脚本不删除重复

import pandas as pd 
f =pd.read_csv("filename.csv") 
    keep_col =['ZIP5','STATE CODE','STATE','COUNTY CODE','COUNTY NAME','CBSA CODE','CBSA TITLE','CBSA LSAD','METRO DIVISION CODE','METRO DIVISION TITLE','METRO DIVISION LSAD','CSA CODE','CSA TITLE','CSA LSAD'] 
    new_f = f[keep_col] 
    new_f.drop_duplicates() 
    new_f.to_csv("newfile.csv", index=False) 

回答

2

您需要分配背部或通过inplace=True

new_f = new_f.drop_duplicates() 

new_f.drop_duplicates(inplace=True) 

docs状态这一点,也一般,几乎所有的熊猫OPS返回副本,最支持inplace因此,您需要指定回覆盖或在支持的位置传递inplace=true