我有一个输入文件,我想读入一个熊猫数据框。 该文件是空格分隔的,包括第一个值之前的空格。 我已经尝试使用“\ W +”正则表达式作为分隔符的read_csv和read_table。 W +分隔符意外的read_csv结果
data = pd.io.parsers.read_csv('file.txt',names=header,sep="\W+")
他们在正确的列数读,但值本身是完全伪造的。是否有其他人遇到过这种情况,或者我使用不正确
我也尝试逐行读取文件,从row.split()
创建一系列并将该系列附加到数据帧,但它似乎因内存而崩溃。
是否有任何其他选项用于从文件创建数据框?
我使用熊猫v0.11.0,Python 2.7版
我的错误与\ W。 \ s +和delim_whitespace都可以工作。文档似乎表明delim_whitespace提供更好的性能。 再次感谢:) – taylormade201