我只是试图导入中文txt文件并打印出内容。 这里是我的txt文件的内容是我从网络,这是简化的中国版本:http://stock.hexun.com/2013-06-01/154742801.html为什么我不能在python中使用编码显示中文字符?
起初,我尝试了这一点:
userinput = raw_input('Enter the name of a file')
f=open(userinput,'r')
print f.read()
f.close()
它可以打开的文件和打印,但什么是节目乱码。 然后我尝试了以下一个与编码:
#coding=UTF-8
userinput = raw_input('Enter the name of a file')
import codecs
f= codecs.open(userinput,"r","UTF-8")
str1=f.read()
print str1
f.close()
但是,它告诉我一个错误消息。 UnicodeEncodeError:'cp950编解码器不能在位置50:非法多字节序列中编码字符u'\ u76d8'。
为什么会发生该错误?如何解决它? 我试过其他的像Big5,cp950等unicode ...但它仍然不起作用。
哪些内容?我复制了文章,它工作得很好。 – aIKid
你能发布你正在使用的确切文本文件吗? – SheetJS