2017-04-16 150 views
2

我有一个数据文件,我试图放入图表等。在数据的某些部分,有-个字符表示未收集数据。我知道data.dropna()通常会完成这项工作,但缺少的数据代表-从熊猫数据框中删除部分无效数据(Python)

+1

情侣选项。假设你正在使用read_csv(),你可以使用na_values arg。或者你做这样的'df.replace(' - ',np.nan).dropna()' –

回答

3

假设我有一个CSV文件test.csv看起来像

col1,col2,col3 
1,-,2 
-,3,4 

我可以告诉pd.read_csv处理'-'nan时,它读取

df = pd.read_csv('test.csv', na_values=['-']) 

df 

    col1 col2 col3 
0 1.0 NaN  2 
1 NaN 3.0  4 

从那里,你可以dropna正常