我正在对20个新闻组数据集进行一些文本分析,部分依赖于根据上述文章中的词语对不同的文章进行分类。我目前能够做的是解析一篇文章,然后编译关于它的统计数据。我可以单独为每篇文章做到这一点,但将文章合并似乎是我的失败。在R中合并数据帧 - 文本分析
什么我期待能够做到,在R为以下几点:
举两个(最好是任何数字)的解析和朵朵字频率dataframes,并把它们合并起来以显示两篇文章中词语的频率作为一个数据框。我希望能够做到这一点,而无需将文章合并为一个大型文档。
拿这个数据帧,并通过顶部的频率排序,只显示前50
任何援助将不胜感激!
我想你正在寻找'merge'。 –