我用下面的代码使用熊猫read_csv
熊猫:处理缺失列
headers = ["1","2","3","4","5"]
fields = ["1", "5"]
for chunk in pandas.read_csv(fileName, names=headers, header=0, usecols=fields, chunksize=chunkSize):
有时我的CSV不会有列“5”读取数据块的CSV文件,我希望能够处理这种情况并指定一些默认值。有没有办法只读取我的CSV文件的标题而不读取整个文件,以便我可以手动处理?或者可能是其他聪明的方式来默认缺失列的值?
可能集'error_bad_lines = FALSE'。 –
@cᴏʟᴅsᴘᴇᴇᴅ事情是我需要为每行的列“5”的值,但有时整个列“5”将丢失,所以我必须回退到默认值。 error_bad_lines = False会忽略该行,不是? –
是的,你是对的。不知道这个。我一直认为熊猫会默认填充NaN。 –