我有5个文档术语矩阵,例如DTM1,DTM2,DTM3,DTM4,DTM5。 现在我写了一个名为myBarPlot(DTM,标题,颜色) 的函数,该函数接受DocumentTermMatrix和标题(字符)到每个绘图并为每个绘图分开颜色。 现在我如何将所有DTM作为参数传递给函数myBarPlot并生成条形图。我希望这发生在一个循环中。 就像这样。 for(i in 1:seq(DTM)) # a
此问题与我先前的问题有关。 Treat words separated by space in the same manner 将它作为单独的发布,因为它可以帮助其他用户轻松找到它。 现在的问题是term document matrix的计算方式是tm包。我想稍微调整一下这个方法。 当前任何期限的文档矩阵都是通过在文档中查找单词'milky'作为单独的单词(而不是字符串)来创建的。例如,让我们假设
我正在尝试创建一个数据框,其中第一列(“值”)在每行中都有一个多字字符串,而其他所有列都有标签,用于表示来自“值”中所有字符串的唯一字。我想用每个字符串(一行)检查所有唯一字(列)的词频来填充这个数据帧。从某种意义上说,创建一个简单的TDM rows = ['you want peace', 'we went home', 'our home is nice', 'we want peace at