我有大约1000个文件名,由os.listdir() 读取,其中一些编码为'utf-8',一部分为'cp1252'。Python检测字符串字节编码
我想将它们全部解码为unicode,以便在脚本中进一步处理。有没有办法让源编码正确解码成unicode?
例子:
for item in os.listdir(rootPath):
#Convert to Unicode
if isinstance(item, str):
item = item.decode('cp1252') # or item = item.decode('utf-8')
print item
避免使用空白'except:'。它抓住了一切,甚至是基于系统的异常。在这种情况下'除了Exception:'或',UnicodeError:'可能是最有意义的。 – twasbrillig 2015-02-11 21:57:28
除了空白处的好处,但我相信正确的异常是'UnicodeDecodeError' – guival 2016-06-07 11:34:24