我使用R中的tm
包创建文本文档的语料库,我想创建一个用于分类的rpart
决策树。然而,我在互联网上找不到任何关于rpart
使用文本数据的例子。它甚至有可能或者我可以使用其他软件包吗?在R中使用tm和rpart:文本数据的决策树?
0
A
回答
1
这里有一个首发:
library(tm)
library(rpart)
docs <- c(txt1="Hello world", txt2="lorem ipsum")
dtm <- DocumentTermMatrix(Corpus(VectorSource(docs)), control = list(weight = weightBin))
m <- as.matrix(dtm)
train <- as.data.frame(m)
train$Docs <- factor(rownames(m), labels=names(docs))
fit <- rpart(Docs~.,data=train, control = rpart.control(minsplit=1))
test <- data.frame(hello=c(1,0),world=c(0,0),ipsum=c(0,1),lorem=c(0,0), row.names=letters[1:2])
predict(fit, newdata=test, type="class")
# a b
# txt1 txt2
# Levels: txt1 txt2
相关问题
- 1. 如何在决策树中使用rpart决定'minsplit'?
- 2. 用r在r上绘制决策树
- 3. 如何获得RPART中决策树的一个终端节点中的数据
- 4. R中决策树的参数
- 5. 如何处理'rpart'中的连续和离散变量 - 使用R的决策树?
- 6. 决策树在树决策中保持使用Y变量
- 7. 如何根据R中的决策树模型测试数据?
- 8. 在R(插图)中绘制决策树
- 9. 如何在R中做决策树?
- 10. 如何使用CSV文件中的数据集决策树?
- 11. R中的决策树公式
- 12. R-从特定分支中提取数据的决策树
- 13. 使用决策树的熵
- 14. 从文本文件写入决策树
- 15. R:应用软件rpart回归树结果到其它数据
- 16. Anova树和Class rpart
- 17. ID3决策树使用web2py
- 18. 打印决策树和feature_importance使用BaggingClassifier
- 19. R:绘制决策树标签离开文本切断
- 20. 使用tf-idf时使用R和tm的新数据
- 21. 使用R中rpart生成的树来分类新观察值
- 22. 决策树样本中标记数据的权重
- 23. pyspark决策树中的样本权重
- 24. 在R的大数据中使用tm的语料库功能
- 25. 决策树中的决策节点和机会节点定义
- 26. 如何在R编程中的决策树中指定分割?
- 27. 由Weka在决策树中运行R中的统计测试
- 28. J48决策树
- 29. 决策树jQuery
- 30. 从数据创建决策树
你在哪里看?应该有[几个例子](https://www.google.com/search?q=“DocumentTermMatrix”+“rpart”) – lukeA