2016-03-02 36 views
0

我有一个带有整数表示字符的向量的文本文件。该文本文件是这样的:R从文本文件中导入int编码字的向量

x<-c(intToUtf8(c(105,110,100,105,118,105,100,117,117,109)), intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110)),...) 

使用它们R I复制内容的文本文件,并将其粘贴在R和当我想看到的值“X”它给了我:

[1] word1 word2 

现在我的文本文件包含9000个字,当我复制粘贴时,需要很长时间才能将所有单词加载到R中,并且在穿过新行时总会出现错误。

所以我尝试:

x <- readLines("text.txt") 
y <- c(x) 
y 
[1] "intToUtf8(c(105,110,100,105,118,105,100,117,117,109)),intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110))" 

正如你所看到的结果不是我所需要的。

我也试着用read.table()给它加上一个表,只有一个元素在位置[1,“V1”],然后使用该元素,但它也没有工作。

如何将单词载入到R中?我不想和我复制粘贴时一样的结果。

谢谢。

回答

0

你可以做

y <- "intToUtf8(c(105,110,100,105,118,105,100,117,117,109)),intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110))" 
x <- strsplit(y, "(?<=\\)\\)),", perl=TRUE)[[1]] 
unname(sapply(x, function(str) eval(parse(text=str)))) 
# [1] "individuum" "einzelperson" 
+0

这是非常密切的,我需要给X只出现前的值:“individuum”“einzelperson” ......我怎么能做到这一点@lukeA? – mitko993

+0

你可以用'unname'来包装它以得到一个未命名的矢量 - 请参阅我的编辑 – lukeA

+0

谢谢你这是我需要的答案 – mitko993