我有一个格式化的这样一个文本文件:如何读取由空格分隔的文本文件到DataFrame中?
A00 0010 00000
A001 0011 00000
A00911 0019 00000
A0100 0020 10000
我想读取这个文件到一个数据帧。所以我尝试过:
import pandas as pd
path = *file path*
df = pd.read_csv(path, sep = '\t', header = None)
我得到的是一个有4行和一列的DataFrame。
0
0 A00 0010 00000
1 A001 0011 00000
2 A00911 0019 00000
3 A0100 0020 10000
[4 rows x 1 columns]
这是因为值不是由“\ t”分隔的。根据字符串的长度不同,列之间的空格数会有所不同。
所需的DataFrame应该有四行三列。
0 1 2
0 A000 0010 00000
1 A001 0011 00000
2 A009 0019 00000
3 A0100 0020 10000
[4 rows x 3 columns]
从我接触大熊猫开始就有一段时间了,但如果你使用''''inste ''\ t''的广告,它不起作用吗? –
不,我试过了。 –
使用'delim_whitespace':'pd.read_csv(data,delim_whitespace = True,header = None,dtype = str)' –