2017-07-05 58 views
2

我有2个csv文件与相似的列。我读,并与下面的代码连接起来将:重复数据帧返回空对象

One = pd.read_csv("/Users/xxx/Documents/Domains/Malaysia - MAR.csv") 
Two = pd.read_csv("/Users/xxx/Documents/Domains/Malaysia - CR.csv") 


links_webtrends_my = pd.concat([One,Two]) 

links_webtrends_my = links_webtrends_my['Page'] 

links_webtrends_my = links_webtrends_my.to_frame(name='Page') 

然后我用这条线下降重复

links_webtrends_my = links_webtrends_my.drop_duplicates(keep='first', inplace=True) 

当我做到这一点,它会删除寄托都在里面。事后我打电话links_webtrends_my,它不会返回任何东西。我会很欣赏这方面的指导。

回答

1

使用inplace=True时,返回对象是NoneType。当使用inplace=True时,将分配移回变量。

links_webtrends_my.drop_duplicates(keep='first', inplace=True) 

或删除inplace = True参数。

links_webtrends_my = links_webtrends_my.drop_duplicates(keep='first') 
+0

我需要使用它作为一个新表,所以选项B像一个魅力工作!谢谢!!! –

+0

@Data_Kid欢迎您。 –