似乎有很多关于在其他语言中这样做的帖子,但我似乎无法弄清楚如何在Python中(我使用2.7)。替换或删除python中的特定unicode字符
为了清楚起见,我希望将字符串保存为unicode,只需要替换某些特定的字符即可。
例如:
thisToken = u'tandh\u2013bm'
print(thisToken)
打印在中间的m破折号字。我只想删除m-dash。 (但不使用索引,因为我希望能够做到这一点的任何地方我发现这些特定的字符。)
我尝试使用replace
就像你使用任何其他字符:
newToke = thisToken.replace('\u2013','')
print(newToke)
但只是不起作用。任何帮助深表感谢。 Seth
,如果你在你的文件的顶部使用'从__future__进口unicode_literals',所有的字符串文字自动unicode的,这将在这里帮助(但要注意的惊喜,当一些字符串必须是字节,可以使用的'b'前缀)。 – RemcoGerlich