1
我有一个亿行的数据集,其中约10个具有某种Unicode替换字符。该特定字符的文本表示是“< U + FFFD>”(删除空格),但也有其他字符。r - 从字符串中删除Unicode替换字符
我想删除角色,但我无法想出办法做到这一点。
str <- "торгово производственн��я компания"
gsub("<U+FFFD>", "", str)
"торгово производственн��я компания"
如果我需要提供任何其他信息,请让我知道。另外我会非常感谢这里发生了什么的解释(就像为什么一个普通的gsub不起作用,为什么它会这样显示)
尝试'GSUB( “\ uFFFD”, “”,STR,固定= TRUE)' –
@WiktorStribiżew谢谢你,完美的工作 – Alexvonrass