2011-12-21 28 views
4

我有存储这样从转换unnnn字母

\u0410\u0411\u0426 

字母一个文件我想CONVER它们例如东西可读 的\u0410\u0411\u0426意味着АБЦ

,但我什么都不知道关于为什么A存储为\u0410或为什么Б存储为\u0411。 我怎么能做这两个之间的转换?

回答

3
$ echo -e '\u0410\u0411\u0426' 
АБЦ 
$ printf '\u0410\u0411\u0426' 
АБЦ 
$ python3 -c 'print("\u0410\u0411\u0426")' 
АБЦ 
$ echo '\u0410\u0411\u0426' | ascii2uni -qaU 
АБЦ 
+0

只是为了澄清:最后一个可以用于“文件”与ascii2uni -qaU <文件 – Nikodemus 2011-12-21 13:25:05

+0

他们都不是在bash 4.1.5中工作,但'echoАБЦ'工作,所以没有编码问题。你是否应用了任何特殊设置? – 2011-12-21 13:56:42

+0

@ A.H。我在'GNU Bash-4.2'上使用'Ubuntu 11.10'。没有特别的设置。 – kev 2011-12-21 13:58:59

1
#irb -E binary 
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426" 
=> "\u0410\u0411\u0426" 

#irb -E utf-8 
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426" 
=> "АБЦ" 

你要读一些关于字符编码,unicodeUTF-8