2016-06-22 41 views
-1

我需要对传入汽车租赁进行分类,但是我可以用于培训的历史数据是“分组”形式的,我无法了解如何训练分类模型。关于分类方法的建议

我的接收数据是汽车型号,数量和单位价格的列表:

Chevrolet Spark, 1, 196.91 
Fiat 500, 1, 196.91 
Toyota Prius Hybrid, 3, 213.73 

该输入数据当前手动分类并保存由类和每组总价分组(雪佛兰和菲亚特是经济普锐斯是混合):

Economy, 393.82 
Hybrid, 641.19 

这个问题应该通过机器学习可以解决的,但我无法弄清楚如何建立一个训练集的监督分类。任何指导赞赏。

感谢

回答

0

朴素贝叶斯分类应该做你正在尝试做的......你可以用价格作为功勋使用,从什么已经被标记学习。

但是,我不明白如何使用总价格进行分类以获得一致的数据,因为您并不总是拥有从一个组到另一个组的许多对象......您将不得不使用单位价格。

+0

问题是我没有任何标签,我没有菲亚特标记为经济其他地方用户的头/纸上。或者我误解了你? –

+0

@joe_c您不能使用已经手动分类为标记火车集的示例吗?编辑:分类只在纸上?人工手动分类不能在电脑上完成? – Carele

+0

的确,它是和手动完成的,并且标记不保存在任何地方。 就是这样,因为数据进来纸(几十行),而不是冲压许多行,他们分组,并注册只有几个分组行。 –

0

有很多算法可以提供多类分类,但是您能否更详细地解释您想要预测的内容?从你写的内容来看,这听起来更像ETL过程而不是机器学习模型。

如果我正确理解你的例子,“Chevy Spark”或“Fiat 500”汽车模型的入场记录将始终标记为“Economy”,而带有“Toyota Prius Hybrid”将被标记为“混合”。一个简单的查找表可以完成这项工作 - 不需要花哨的机器学习数学。 :)

+0

我尝试根据分组的历史数据来预测汽车的标签(所以我没有清洁汽车 - >标签数据来构建查找)。你是对的,Chevy Spark和菲亚特500将永远被贴上经济标签等,我只是希望我能用ML来识别汽车的标签:) –