2017-03-29 47 views
0

我有一些csv文件以数字形式存在一些数据,例如睡眠时间,工作时间等数据以及二进制数据,例如我是否参加过考试。有了这些数据,我试图预测我今天看电视的时间有多少。问题在于我不确定哪种WEKA算法或方法可能最好?由于我试图预测一个数值,并有一些变量是数字和其他二进制....我会很感激任何帮助!Weka练习选择最佳算法

回答

0

一种选择是将这个回归问题分解成一个分类问题,也就是说你可以以30分钟的间隔递增。

需要考虑的另一件事是你在这个回归中期望的精度数量,我的意思是说你的分类器能够区分10分钟的电视和11分钟的电视吗?如果不会,但是再次,这取决于您的应用程序。

另外,您有多少个数据实例?数据集有多种多样?我建议首先使用简单的朴素贝叶斯分类器,因为它不太容易出现过度拟合,比随机森林(当数据量低时)更容易。