0
当我调查所得到的DTM矩阵,我发现的记号是小写,除非设置被设置为False。此外,带有下划线的单词在标记之前被拆分。R中包tm的函数DocumentTermMarix的默认控制设置是什么?
当我抬头看documentation我无法检索默认设置,或者如果没有提供明确的控制使用哪些设置。
在哪里可以找到呢?
当我调查所得到的DTM矩阵,我发现的记号是小写,除非设置被设置为False。此外,带有下划线的单词在标记之前被拆分。R中包tm的函数DocumentTermMarix的默认控制设置是什么?
当我抬头看documentation我无法检索默认设置,或者如果没有提供明确的控制使用哪些设置。
在哪里可以找到呢?
为DocumentTermMatrix
的文件说,“看到termFreq
可用的本地控制选项。”
如果你这样做:
?termFreq
你会看到所有的默认设置可能的选项(包括“默认为tolower
”你指的是)。
OP,要知道,你引用的帖子(DocumentTermMatrix)的标题一个功能,但你提供一个链接到另一个函数(TermDocumentMatrix)的文档。 –
谢谢。我同意我不会看到这一点,但我会在这里留下问题(除非有太多的投票来删除它),因为这是什么显示如果你谷歌的“r tm Term-Document Matrix默认设置”对一些人有用。 – user1603472