2
我有一个数据文件,我试图放入图表等。在数据的某些部分,有-
个字符表示未收集数据。我知道data.dropna()
通常会完成这项工作,但缺少的数据代表-
。从熊猫数据框中删除部分无效数据(Python)
我有一个数据文件,我试图放入图表等。在数据的某些部分,有-
个字符表示未收集数据。我知道data.dropna()
通常会完成这项工作,但缺少的数据代表-
。从熊猫数据框中删除部分无效数据(Python)
假设我有一个CSV文件test.csv
看起来像
col1,col2,col3
1,-,2
-,3,4
我可以告诉pd.read_csv
处理'-'
像nan
时,它读取
df = pd.read_csv('test.csv', na_values=['-'])
df
col1 col2 col3
0 1.0 NaN 2
1 NaN 3.0 4
从那里,你可以dropna
正常
情侣选项。假设你正在使用read_csv(),你可以使用na_values arg。或者你做这样的'df.replace(' - ',np.nan).dropna()' –