我需要使用python脚本从某些字符串中删除表情符号。我发现已经有人问过这个question,答案的一个标记为成功,即下面的代码会做的伎俩:从python字符串中删除emojis
#!/usr/bin/env python
import re
text = u'This dog \U0001f602'
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"]+", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
我插入这个代码到我的剧本,并改变了它只能是在我的代码而不是示例文本中对字符串进行操作。当我运行的代码,但是,我得到了一些错误,我不明白:
Traceback (most recent call last):
File "SCRIPT.py", line 31, in get_tweets
"]+", flags=re.UNICODE)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework /Versions/2.7/lib/python2.7/re.py", line 194, in compile
return _compile(pattern, flags)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework/Versions/2.7/lib/python2.7/re.py", line 251, in _compile
raise error, v # invalid expression
sre_constants.error: bad character range
我得到了错误的说法,但因为我一把抓起Stackexchange这个代码,我想不通为什么它显然奏效对于这个讨论中的人们而言,不适合我。如果有帮助,我使用Python 2.7。谢谢!
'sys.maxunicode'说? –