下面的代码产生一个简单的比较云:řcomparison.cloud角位置
library(tm)
library(wordcloud)
text1<- "cat cat dog dog dog bird bird bird bird bike bike bike"
text2<- "cat cat dog dog dog dog fish fish fish fish car car"
tmpText <- data.frame(c(text1, text2))
row.names(tmpText)<- c("text1", "text2")
ds <- DataframeSource(tmpText)
corp <- Corpus(ds)
corp <- tm_map(corp, PlainTextDocument)
corp <- tm_map(corp, content_transformer(tolower))
corp<- tm_map(corp, removePunctuation)
tm <- TermDocumentMatrix(corp)
tm<- as.matrix(tm)
colnames(tm) <- c("text1", "text2")
comparison.cloud(tm, , scale=c(5, 1))
我有2个问题:
1-如果两个词有在多个文档中的相同频率,如何封装决定将其显示在一个子云中VS其他
2-根据文档:“每个字...其角位置由最大发生的文档决定。”我多次运行比较云,没有种子,我无法理解解释,我做了谷歌搜索解释,没有发现太多,在这种情况下,“角位置”是什么意思?
帮助是极大的赞赏
MJJ
读取从GitHub时,#颜色=#文档的源代码,被预定和固定: 颜色= brewer.pal(NcoI位(term.matrix), “深色2”) ..... 文本(X1 ,y1,words [i],cex = size [i],offset = 0,srt = rotWord * 90, col = colors [group [i]],...) #group [i]文本属于 MJJDeveloper – MJJ