我使用pandas.read_csv来读取空格分隔的文件。该文件在每行前面有一个可变数量的空白字符(数字右对齐)。当我读这个文件时,它创建了一列NaN。为什么会发生这种情况,以及防止它发生的最佳方法是什么?使用熊猫阅读带有空白符的文本文件给出NaN列
例子:
文本文件:
9.0 3.3 4.0
32.3 44.3 5.1
7.2 1.1 0.9
命令:
import pandas as pd
pd.read_csv("test.txt",delim_whitespace=True,header=None)
输出:
0 1 2 3
0 NaN 9.0 3.3 4.0
1 NaN 32.3 44.3 5.1
2 NaN 7.2 1.1 0.9
它看起来像有人[在GitHub上开辟了一个问题(https://github.com/pydata/pandas/issues/3374)基于这个帖子: – Caleb