2015-06-27 45 views
0

我有一组数据。预测将完成数据类型。我正在使用Weka作为模型。 (如yyyy-MM-dd HH:mm:ss)什么是最佳使用方式?我使用了很多可用的,但是在训练数据中都有很高的误差。请帮助我这个什么是预测的最佳模型日期类型

回答

0

你有的问题可能是因为Weka认为每个日期为它自己的类,不会因为显而易见的原因工作。

首先要解决这个问题,你应该转换为已知的问题。不要试图预测日期,而应尝试预测以天/月/年为单位的偏移量。假如你需要预测明年的某一天会发生一些事件,而不是像11-08-2016那样进行预测,那么将其转换为年初以来的天数。或者,如果您试图预测的所有事件都会在2016年发生(并且可能在未来几年发生),请尝试预测自01-01-2016以来的天数。

您可以选择一种所谓的“回归分析”算法,从特征向量中预测一个数字。我建议首先尝试使用linear regression算法,因为它快速且不太可能过度使用您的数据,但您也可以考虑其他算法,如neural networks

请注意,如果您的特征向量包含日期,则应首先将它们转换为相对值,因为像(08-10-2014)这样的绝对日期可能会被W​​eka视为名义值,并不会有助于提高模型的准确性,而诸如“年龄年龄”或“上次就诊后的时间”等相对值可以有效地用于预测。

相关问题