我想运行源代码中包含unicode(utf-8)字符的Python源文件。我知道这个事实可以通过在开头添加注释# -*- coding: utf-8 -*-
来完成。但是,我希望不使用这种方法。运行源代码中使用Unicode字符的Python 2.7代码
我能想到的一种方法是以转义形式写入unicode字符串。例如,
编辑:更新源。添加了Unicode注释。
# Printing naïve and 男孩
def fxn():
print 'naïve'
print '男孩'
fxn()
成为
# Printing na\xc3\xafve and \xe7\x94\xb7\xe5\xad\xa9
def fxn():
print 'na\xc3\xafve'
print '\xe7\x94\xb7\xe5\xad\xa9'
fxn()
我有一个关于上述方法的两个问题。
- 如何将使用Python的第一个代码片段转换为与 一样的第一个代码片段?也就是说,只有unicode序列应该写入 转义形式。
- 考虑到只使用unicode(utf-8)字符,该方法是否万无一失?有什么可以出错的吗?
UTF-8 = Unicode的! UTF-8是Unicode字符集的编码 –