Unicode编码/解码

我有一个看起来像这样的字符串。Unicode编码/解码

st = '/M\xe4rzen'

我想将这个转化为unicode。我怎样才能做到这一点？我已经试过：

st.decode('utf-8') 
unicode(t, 'utf-8')

原始文件是UTF-8编码，但我似乎无法得到字符串的Unicode表示。

您的数据不是UTF8编码;越有可能是使用Latin-1编码：

>>> print st.decode('latin1') 
/Märzen

调用.decode()就足够了，没必要也呼叫unicode()。

2013-03-26 12:47:25

回答