初学者python(以及大熊猫)用户。我正在尝试将一些数据导入到熊猫数据框中。其中一列是日期,但格式为“YYYYMM”。我试图做什么最论坛回答表明:Python - Pandas - 将YYYYMM转换为datetime
df_cons['YYYYMM'] = pd.to_datetime(df_cons['YYYYMM'], format='%Y%m')
这不工作,虽然(ValueError: unconverted data remains: 3
)。该列实际上包含每年的附加值,MM = 13。来源使用此行作为过去一年的平均值。我猜测to_datetime
有问题。
任何人都可以提供一个快速解决方案,或者去掉所有的年平均值(那些最后两位数字为“13”),或者让to_datetime
忽略它们吗?
您是否在导入数据时尝试解析它?例如,如果你在pandas中用'read_csv'读取一个csv,你有一个参数'parse_dates = [your_col_name]' – ysearka