2016-10-09 43 views
-1

我收到了一些混合了英语和非英语语言(确切地说是高棉语)的Facebook帖子。如何显示Facebook API获取的非英语语言

下面是打印数据时屏幕上显示非英文的方式或将其保存到文件:\ u178a \ u17c2 \ u1787b \ u17b6 \ u17a2 \ u17d2。我宁愿把它显示为ឈឹមបញ្ចពណ៌(注:这不是以前的Unicode的翻译。)

+1

哪个Python版本和操作系统?你如何从Facebook获得数据?你是否从utf-8解码它? – tdelaney

+0

2.7.9,Mac。不,我不是从UTF-8解码它。当我尝试时,出现错误:'ascii'编解码器无法解码位置268中的字节0xc3:序号不在范围内(128) – lars

+1

当您尝试写入文件时,可以添加输入吗? – estebanpdl

回答

1

这应该是它:

print(u'\u1787\u17b6\u17a2\u17d2') #python3 
print u'\u1787\u17b6\u17a2\u17d2' #python2.7 

输出:ជាអ្

0

在pycharm我加:

  1. (在顶部)# - - 编码:UTF-8 - -

  2. 进口SYS 重载(SYS) sys.setdefaultencoding函数( 'UTF8')

  3. S = json.dumps(帖[ '数据'],ensure_ascii =假)
  4. json_file.write(s.decode ( 'UTF-8'))
2

,如果你想保存在一个文件中的信息试试这个:

import codecs 

string = 'ឈឹម បញ្ចពណ៌' 
with codecs.open('yourfile', 'w', encoding='utf-8') as f: 
    f.write(string) 
相关问题