我想绘制单词的最高相关性。例如,我想绘制“鲸鱼”这个词的最高十个相关关系。有人能帮助我解决类似的问题吗?如果有帮助,我安装了RGraphViz。绘制高度相关的单词以针对特定的兴趣单词
s.dir1<-"/PATHTOTEXT/MobyDickTxt"
s.cor1<-Corpus(DirSource(s.dir1), readerControl=list(reader=readPlain))
s.cor1<-tm_map(s.cor1, removePunctuation)
s.cor1<-tm_map(s.cor1, stripWhitespace)
s.cor1<-tm_map(s.cor1, tolower)
s.cor1<-tm_map(s.cor1, removeNumbers)
s.cor1<-tm_map(s.cor1, removeWords, stopwords("english"))
tdm1 <- TermDocumentMatrix(s.cor1)
m1 <- as.matrix(tdm)
v1 <- sort(rowSums(m), decreasing=TRUE)
d1 <- data.frame(word = names(v),freq=v)
什么样的图?你必须比这更明确。 –
我真的没有偏好。我正在展示一些研究,涉及查看历史文献中的情感词汇之间的关联。因此,任何能够让观众成员仔细查看关系的事情对我来说都是好事。 – user2890975
那么我会推荐一个dotplot。请使用谷歌福与R和dotplot,并尝试找出你自己的。 –