2017-06-22 172 views
0
import re 
test = unicode("شدَد", encoding='utf-8') 
test = test.replace(u"\u064e", "") 

这是删除一个字符的代码。我想用0627代替任何以下unicode字符:0622,0623,0625。这是阿拉伯语言。我知道如何在多行中做到这一点,但有一种方法可以做到这一点?替换unicode python中的多个字符

+1

https://stackoverflow.com/questions/3411771/multiple-character-replace-with-python –

回答

1

如果你想多个字符(Unicode代码点),以在oneliner更换,你可以用一个简单的交替regex

import re 
test = unicode("شدَد", encoding='utf-8') 
test = re.sub(u"\u064e|\u0634", "", test, flags=re.UNICODE) 

或者,与一系列的正则表达式:

test = re.sub(u"[\u064e\u0634]", "", test, flags=re.UNICODE)