2014-07-23 284 views
0

删除疯狂字符我在格式一长串像这样:在R /闪亮

group1 » group2 » group3 

在R,I可以使用gsub('»', '-', x)其中x是结构类似于上面的载体。

但是,当我尝试利用这个功能加载到一个闪亮的应用程序时,我遇到了错误。我试过多种方式使用gsub,chartr和其他一些。

另外,使用[[:punct:]]时,不会捕获Â字符。

有什么建议吗?

+0

你想要什么字符*保留*,字母数字? – rawr

+0

有时使用冒号和分号。所以,字母数字加上几个特殊字符 – maloneypatr

+0

你尝试过'gsub(“[^ A-Za-z0-9]”,“ - ”,x)'? –

回答

0

group1 » group2 » group3UTF-8编码的字符串,因此如果ř应用是编码来自UTF-8读取转换的字符串,以拉丁1作为Read or Set the Declared Encodings for a Character VectorRead text as UTF-8 encoding解释这将是最好的。

»是UTF-8编码right-pointing double angle quotation mark由此2个字节用十六进制值C2 BB与代码页Windows-1252ISO 8859-1(Latin-1的)解释并显示的(错误的)。

gsub("\\xC2?\\xBB", "-", x)可用于在UTF-8编码字符串或单字节编码字符串(拉丁语1或Windows 1252)中找到所有正确的指示字符并用连字符替换它们中的每一个。