我试图用gsub
替换我认为是标准破折号的东西。我测试的代码是:带特殊字符的R gsub
gsub("-", "ABC", "reported – estimate")
这什么都不做,虽然。我复制并粘贴到http://unicodelookup.com/#–/1破折号,它似乎是一个破折号。该网站提供了一个破折号的十六进制,十进制等代码,我一直试图替换破折号,但没有运气。建议?
(作为奖励,如果你能告诉我是否有函数来识别特殊字符会有帮助)。
我不确定是否SO的代码格式会改变破折号格式,所以这里是我使用的破折号( - )。
这太好了。也许我没有用“特殊字符”来使用正确的术语。我的意思是不是标准的UTF-8字符。例如,ô - 当使用readr :: write_csv()导出时,我发现这些字符看起来很奇怪。您可以修改gsub以将“ô”识别为“特殊字符”。 – ZRoss
你可以用正则表达式来匹配所有ascii:'gsub(“[[:ascii:]] +”,“”,s)'。这将从字符串中删除所有ASCII字符,保留结果中的所有Unicode字符。 –
因为这是一个PCRE构造,所以你只需要将'perl = T'用于上面的正则表达式模式。 –