2011-11-08 128 views
13

我有一个二进制文件。该文件包含一个UTF-8字符串。而且,保证这个字符串只是一个单词。 在python中,我怎样才能得到这个字符串中的字母数?python获取unicode字符串大小

比方说,我打开这个文件并读取的字节:

bytes = open("1.dat", "rb").read() 

下一步有我做找出长度(字母,而不是字节)UTF-8字符串的?

+0

“它保证这个字符串只是一个单词”的相关性是什么? –

+2

不要以二进制模式打开文件。用'codecs.open'打开它并给它一个编码参数。问题解决了。 – tchrist

回答

28
unicode_string = bytes.decode("utf-8") 
print len(unicode_string) 
+2

在Python 3中,可以设置'bytes = len(open('1.dat',encoding ='utf-8')。read())' – Cito

相关问题