2013-08-07 38 views
2

我试图读取由Sql Server Management Studio生成的csv文件,并将其编码为UTF-8(我选择该选项保存时)到R版本3.0.1(x64)至read.csv2()。我不能R正确显示特殊字符。R中的字符编码

如果我设置fileEncoding="UTF-8-BOM"导入停在我有一个line的那一行。但是,在Notepad++中打开文件时,ÿ会以UTF-8编码正确显示。我试过没有设置fileEncoding,但是然后特殊字符显示不正确(当然)。

的CSV flie可以在这里找到: https://www.dropbox.com/s/7y47i826ikq8ahi/Data.csv

我如何读取csv文件,并显示在正确的编码的文本?

谢谢!

回答

2

我找到了答案我的自我。问题在于从UTF-8到系统区域设置(R中的默认编码)通过fileEncoding转换。当我使用RStudio时,我只是将默认编码更改为UTF-8,并从read.csv中删除了fileEncoding="UTF-8-BOM"。然后,读取整个csv文件,RStudio正确显示所有字符。

0

对于那些仍然陷于这个问题。我的脚本能够通过在脚本的顶部添加一行代码来识别“umlaute”(ä,ö,ü或ß),该行改变了字符编码的默认选项options(encoding = "UTF-8")(在我的情况下,在RStudio direclty中设置选项没有'不会影响编码!)。