当试图使用pmml包导出R分类器到PMML时,我注意到树中节点的类分布没有被导出。R PMML类的分布
PMML支持这一与ScoreDistribution元素:http://www.dmg.org/v1-1/treemodel.html
反正是有有在PMML这一信息?我想用另一个依赖于这些信息的工具读取PMML。
我做这样的事情:
library(randomForest)
library(pmml)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)
我的确在使用randomForest包。我查看了Weka的RandomForest来源,它们提供了分数分布。为什么R不是一样的? 我已经编辑我有我使用的示例代码问题。 – halfwarp
所以,正如我所说的,原因是在R“随机森林”包,而不是“PMML”。我不能说为什么该软件包的作者不选择输出这些信息,但是如果我不得不猜测,那是因为这些信息可能不是必需的?通常情况下,ScoreDistribution用于计算预测的概率...随机森林,我相信,这是否通过简单地计票的数量。 – Tridi