2013-04-29 53 views
0

这是我遇到的问题。我希望有人能解释为什么R randomForest组合模型 - 错误消息

我有我使用的预测分类值大的数据集 - L,M,H - 在原来的data.frame这是一个因素。

训练集是大的,所以我没有足够的内存就可以了训练 - 所以我把我的训练数据集的样本,并创建一个随机森林。然后,我创建了一个不同的随机样本,创建了第二个森林,...。他们都有着相同的性能这是一个问题

我找到了结合功能随机森林,并决定用它来我的模型结合起来。

然后我需要用新的模式将比分列车设置为得到一个OOB估计和我的验证样本则是相同的。

我对测试集上的预测有问题。

我基本上得到一个消息,说“错误的eval(表达式,envirmenclos):对象‘XXX’未找到”,其中XXX是变量名。但这是没有意义的,因为变量从未改变名称

我重复了这几次,以防万一我的数据损坏。

任何想法,为什么我得到这个?

+0

不可能没有一个重复的例子说。但总的来说,错误信息并不是谎言。如果R说它找不到你的一个变量,那么它确实无法找到你的一个变量。 – joran 2013-04-29 21:11:00

回答

0

没有这些数据,是很难知道,但是这是在过去 - 基于类似的错误,如果是抽样数据并运行独立的模型我的预感,你可能会遇到与分类变量的问题,其中一个因子水平模型与其他模型的因子水平不匹配。可能解决此问题的方法是在运行模型之前在数据框中指定因子水平(使用水平函数)。

编辑 - 一种方式登场在同一样本数据将它们结合起来,并尝试应用该模型,看看你得到同样的错误运行两种模式..

+0

谢谢,寻求帮助 – user1617979 2013-04-30 02:06:39

+0

因素是在数据框架上定义的。问题在于变量名称,我已经对它们进行了改造,并且我猜想在做同样的转换时我没有那么小心 – user1617979 2013-04-30 02:08:14