3
我有一个看起来像这样的字符串。Unicode编码/解码
st = '/M\xe4rzen'
我想将这个转化为unicode。我怎样才能做到这一点?我已经试过:
st.decode('utf-8')
unicode(t, 'utf-8')
原始文件是UTF-8编码,但我似乎无法得到字符串的Unicode表示。
我有一个看起来像这样的字符串。Unicode编码/解码
st = '/M\xe4rzen'
我想将这个转化为unicode。我怎样才能做到这一点?我已经试过:
st.decode('utf-8')
unicode(t, 'utf-8')
原始文件是UTF-8编码,但我似乎无法得到字符串的Unicode表示。
您的数据不是UTF8编码;越有可能是使用Latin-1编码:
>>> print st.decode('latin1')
/Märzen
调用.decode()
就足够了,没必要也呼叫unicode()
。