-1
我正在尝试在SPSS中编写语法来修改值。当我尝试阅读我的数据集,它可以读取第243项,但失败了读出错误:使用python读取SPSS数据集时出现UnicodeDecodeError错误
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 253: unexpected end of data
我的代码:
BEGIN PROGRAM.
import json, re, spss
spss.StartDataStep()
datasetObj = spss.Dataset()
for i in range(len(datasetObj.cases)):
print datasetObj.cases[i,0]
spss.EndDataStep()
END PROGRAM.
我如何可以读取当前数据集没有错误?
Unicode的 “码点” A与代字号(Ã)是'U + 00C3'。但是,OP的错误表示0xc3是部分十六进制的UTF-8编码。去掉'0x',你剩下'c3';不是一个字符本身。 UTF-8编码的Ã为“C383”或更好:“0xC3 0x83”。同样,大写O与中风(Ø)是'0xC3 0x98'。结论:一个UTF-8代码“0xC3”后面总是跟着另一个代码。只是'0xC3'不是字符,所以不能被解码。 '0xC3'用于扩展拉丁字母集。 [此列表](http://www.fileformat.info/info/charset/UTF-8/list.htm)很好参考。 –