-1
A
回答
2
TM具有功能stemCompletion()
x <- c("completed","complete","completion","teach","taught")
tm <- Corpus(VectorSource(x))
tm <- tm_map(tm, stemDocument)
inspect(tm)
dictCorpus <- tm
tm <- tm_map(tm, stemDocument)
tm <- tm_map(tm, stripWhitespace, mc.cores=cores)
tm<-tm_map(tm, stemCompletion,dictionary=dictCorpus)
至于完成动词目前的紧张,我不知道这是可能的TM。也许RWeka,word2vec或qdap将有方法,但我不确定。
一个快速和肮脏的解决方案可能是设置type = shortest
在stemDocument
通常我认为现在时单词将比过去式和动名词短。
相关问题
- 1. R文本分析的拼写感知词干
- 2. 显示词干词和使用haskell的词干分析
- 3. 词法分析器应该完成哪部分解析?
- 4. 禁用词干上查询分析器
- 5. ElasticSearch - 与词干分析器无结果
- 6. 在R中使用基本词词根而不是根词干
- 7. 在数据帧词干文本列有R
- 8. 文化无关的词干/分析仪Lucene.NET
- 9. R中的成对分析
- 10. Python中的停止词消除和词干分析器
- 11. DebugDiag未完成分析
- 12. R中的子图文本分析(igraph)
- 13. 定义 - R的包文本分析
- 14. R中的主成分分析,ggbiplot
- 15. R中的主成分分析
- 16. R词典在词典中的情感分析
- 17. [R词干砍的话太多
- 18. r中的词干:缺失值
- 19. 词法分析
- 20. 词法分析
- 21. Xcode flex词法分析器未生成
- 22. 拆分大文本字符串分成若干小的
- 23. ANTLR:如何用python生成词法分析器和分析器?
- 24. 词性分析(POS)标签文本分类的特征选择
- 25. R data.table文本解析
- 26. 新版本应该在版本控制的干线或分支中完成?
- 27. 带有词干分析器的Lucene荧光笔
- 28. 解析文本文件而不分裂多个词的名称
- 29. 使用tm-package进行文本挖掘 - 词语词干
- 30. 未能在VSTS中“完成SonarQube分析”