2016-08-24 85 views
0

,当我试图通过下面的代码读取Excel文件:XLRDError阅读的XLS文件

import os 
import xlrd 

files = os.listdir(".")[1:101] 


for file in files: 
    workbook = xlrd.open_workbook(file) 

,但我得到一个错误信息是这样的。

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\r\n\r\n\r\n\r\n'

所以我试着一个一个打开文件。

而且我发现命名为这样的文件是可读的,命名为喜欢这种格式 “14.08.01-08.07.xlsx.xlsx” 但文件无法读取。 “14.08.22-08.28.xlsx.xls

于是我打开的文件,发现带扩展名“xlsx.xls”文件有问题,编码。

这些文件包含韩文字符,所以我试图通过将编码更改为utf-8来打开它们,这是徒劳的。

总之,我认为我不能读取xlsx.xls文件,因为编码问题。

有没有办法解决这类问题?

+0

也许[这](http://stackoverflow.com/questions/3511743/using-xlrd-to-read-excel-xls-file-containing-chinese-and-or-hindi-字符)有帮助吗? – lrnzcig

+0

他们是'xls'还是'xlsx'格式 - 奇怪的文件扩展名命名在那里... –

回答

1

尝试xlrd.open_workbook(file, encoding_override="utf-8")