开始与文件两个语料库,每个都有相同数量的文档元素方面,两个语料库:如何连接,R中使用TM
library(tm)
c1 <- Corpus(VectorSource(c("document 1 corpus 1 text", "document 2 corpus 1 text")))
c2 <- Corpus(VectorSource(c("document 1 corpus 2 text", "document 2 corpus 2 text")))
我想相同数量的单个语料库联合逐元素,以形成一个单一的文件,相当于该术语的文档:
c3 <- Corpus(VectorSource(c("document 1 corpus 1 text document 1 corpus 2 text",
"document 2 corpus 1 text document 2 corpus 2 text"))
搜索已经转向了tm_combine
功能,但组合来自不同语料库的文档转换成一个单一的语料库具有两倍(或,个人的总和)文件的数量秒。
@Jota这看起来像一个很好的答案 –
@Jota是的!这是完美的。我不知道“内容”功能。 Upvoted评论,但作为答案,我会接受。 – Sealander