我有一个csv文件,其内容全部是中文(标题除外)。因为我想读取文件作为字典(其中栏标题是关键),我做了以下内容:如何阅读python中的utf-8 csv中文文件
import csv
d = csv.DictReader(open('file.csv', 'rU')
final = []
for row in d:
final.append(row)
但是,当我尝试访问的值,该值被各个击破,并显示了这样的:
'\xe4\xb8\x8a\xe6\xb5\xb7\xe5\xba\xb7\xe8\xa1\x8d\xe6\x8a\xa4\xe7\x90\x86\xe7\xab\x99'
因此file.csv
是一个UTF-8 csv文件(最初由Excel制作并保存为xlsx,后来保存为csv文件)。我如何在Python 2.7中读取这个文件?
嗨,我试过my_byte.decode('utf8'),但我得到的结果是'u4e0a \ u6d77 \ u5eb7 \ u884d \ u62a4 \ u7406 \ u7ad9',这是对的吗? – song0089
@ song0089是的,这是一个unicode字符串的repr。然后,您可以在使用文本的任何地方使用它。如果你打印到终端,它应该显示为中文字形,如果你有它的GUI,它应该为用户提供正确的东西,等等。 –
https://nedbatchelder.com/text/unipain.html –