我正在读取从某个库中检索的pickle文件。在unicode字符串中存储了很多utf-8字符。例如:python打印存储在unicode字符串中的utf-8字符
u'\xc4\x91' #đ
u'\xc3\xad' #í
u'\xc3\u017d' #�\u017d
...
我可以编码和使用raw_unicode_escape
然而所有的字符与\u
逃逸像第三个以上显示不正确显示大部分:�\u017d
。我该如何解决这个问题? 编辑: 每个字符串上面应该是一个性格
编辑2:我用它来读取文件
model_dir = '../../projects/python/test/model-5'
with open(model_dir, 'rb') as f:
model = pickle.load(f)
seq = model.sequitur
rightI = seq.rightInventory
print repr(rightI.list)
代码
结果中包含类似上述例子
你是什么意思不正确?你能举个例子吗? –
也许你在控制台编码方面有问题?尝试将您的输出写入文件而不是标准输出。 – damians
@LaurynasTamulevičius我刚刚根据你的要求添加了 – AtheS21