2017-06-22 148 views
0

我想读取一个CSV文件并将其保存为熊猫中的数据帧。用不同的分隔符(逗号)阅读熊猫的csv

但是我有一个问题,因为我有行是这样的:

BG,6141.6,6141.6,,3.0,,,ic 

正如你看到有三个分离:',,,'',,',

我该如何正确加载它变成熊猫吗?

+2

你应该在数据仔细看,很有可能是多个分离器将意味着你的数据有8列,但列4,6和7这个特定的行是空的 – Vaishali

+0

是因为列是空的还是其他原因? –

+0

你应该说明你已经尝试了什么,以及为什么你认为它没有工作。 – bli

回答

2

使用正则表达式分隔[,]+ - 一个或多个,

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""iBG,6141.6,6141.6,,3.0,,,ic""" 
#after testing replace 'StringIO(temp)' to 'filename.csv' 
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python') 
print (df) 
    0  1  2 3 4 
0 iBG 6141.6 6141.6 3.0 ic