2016-10-19 173 views
5

我有一个熊猫read_csv问题。我曾与股票market.It的关联像这样的很多txt文件:问题处理熊猫阅读csv

SecCode,SecName,Tdate,Ttime,LastClose,OP,CP,Tq,Tm,Tt,Cq,Cm,Ct,HiP,LoP,SYL1,SYL2,Rf1,Rf2,bs,s5,s4,s3,s2,s1,b1,b2,b3,b4,b5,sv5,sv4,sv3,sv2,sv1,bv1,bv2,bv3,bv4,bv5,bsratio,spd,rpd,depth1,depth2 
600000,浦发银行,20120104,091501,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.600,8.600,.000,.000,.000,.000,0,0,0,0,1100,1100,38900,0,0,0,.00,.000,.00,.00,.00 
600000,浦发银行,20120104,091506,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,33605,0,0,0,.00,.000,.00,.00,.00 
600000,浦发银行,20120104,091511,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,34605,0,0,0,.00,.000,.00,.00,.00 
600000,浦发银行,20120104,091551,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,35205,0,0,0,.00,.000,.00,.00,.00 
600000,浦发银行,20120104,091621,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,57795,57795,34205,0,0,0,.00,.000,.00,.00,.00 

,而我使用此代码来阅读:

fields = ['SecCode', 'Tdate','Ttime','LastClose','OP','CP','Rf1','Rf2'] 
df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields) 

但是我有一个问题:

Traceback (most recent call last): 
    File "E:/workspace/Senti/highlevel/highlevel.py", line 8, in <module> 
    df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields,header=1) 
    File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 562, in parser_f 
    return _read(filepath_or_buffer, kwds) 
    File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 315, in _read 
    parser = TextFileReader(filepath_or_buffer, **kwds) 
    File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 645, in __init__ 
    self._make_engine(self.engine) 
    File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 799, in _make_engine 
    self._engine = CParserWrapper(self.f, **self.options) 
    File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 1257, in __init__ 
    raise ValueError("Usecols do not match names.") 
ValueError: Usecols do not match names. 

我找不到类似于mine的任何问题,并且当我将txt文件复制到另一个时,它会连线,代码运行良好,但原来的问题导致了上述问题。我该如何解决它?

+0

Usecols不匹配名称。 – vmg

+1

可能是编码问题? – intrepidhero

+1

我没有使用anaconda,只是空闲和PANDAS,我没有得到上述代码的错误。 –

回答

2

在你的消息,你说你是一个正在运行:

df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields) 

哪个没有抛出一个错误,我和@Anil_M。但是,从您的回溯,可以看到使用的命令是另一个问题:

df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields, header=1) 

其中包括header=1和它抛出提到的错误。

所以,我想这个错误来自你的代码的一些混淆。

+1

是的,最有可能'header = 1'导致这个问题... OP应该尝试省略使用它或将其更改为'header = 0'(这是默认值) – MaxU

0

使用names而不是usecols指定参数。