我有一个如下的数据集。我们只有一个月的最后一天的数据,我试图插入其余部分,这是否正确?Python熊猫数据帧插入缺失数据
Date Australia China
2011-01-01 NaN NaN
2011-01-02 NaN NaN
- - -
- - -
2011-01-31 4.75 5.81
2011-02-01 NaN NaN
2011-02-02 NaN NaN
- - -
- - -
2011-02-28 4.75 5.81
2011-03-01 NaN NaN
2011-03-02 NaN NaN
- - -
- - -
2011-03-31 4.75 6.06
2011-04-01 NaN NaN
2011-04-02 NaN NaN
- - -
- - -
2011-04-30 4.75 6.06
对于插值这个数据帧寻找失踪NaN值我使用下面的代码
import pandas as pd
df = pd.read_csv("data.csv", index_col="Date")
df.index = pd.DatetimeIndex(df.index)
df.interpolate(method='linear', axis=0).ffill().bfill()
但我得到一个错误“类型错误:无法与所有NaN的插值。”
这里可能有什么问题,我该如何解决这个问题?
谢谢。
该错误是不言自明的。你可以尝试按照这个http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html – station
删除NaN嗨,感谢您的帮助,而不是NaN我可以填写什么那些行? – Unnikrishnan
@Unnikrishnan我想,已经给出了很好的答案。您的数据非常稀少,因此您可能需要质疑实际插入大量数据是否是个好主意。你有多确定这些数值会有点正确? –