我正在使用Python 2.7在Python中,“utf8”字符串编码的类型是什么?
我正在读取包含“iso-8859-1”编码信息的文件。 解析后,我得到的字符串的结果,即s1
:
>>> s1
'D\xf6rfli'
>>> type(s1)
<type 'str'>
>>> s2=s1.decode("iso-8859-1").encode("utf8")
>>> s2
'D\xc3\xb6rfli'
>>> type(s2)
<type 'str'>
>>> print s1, s2
D�rfli Dörfli
>>>
为什么是s2
仍然是一个str
调用.encode
后的类型? 如何将它从str
转换为utf-8
?
我不熟悉Python,但是你认为'utf-8'是什么类型?此外,产量如预期;你还想要什么? –
此演示文稿可能会帮助您了解基本原理:[实用Unicode,或者,我该如何阻止疼痛?](http://bit.ly/unipain)。 –