2012-12-19 33 views
1

我的数据由以下对象组成。在这种情况下可以使用哪些机器学习算法?

OBJ1 - 颜色 - 形状 - 大小 - 价格 - 排名

所以我想能够预测颜色/形状/大小的什么样的组合/价格是一个很好的组合,以获得高的排名。或者甚至一个组合可以工作,例如:为了获得良好的排名,ALG预测这种颜色和这种形状的最佳性能。类似的东西。

这种预测的可行算法是什么?

也可以,如果你可以简要解释我如何可以接近模型建设,我真的很感激它。对于例如:我的数据看起来像

Blue pentagon small $50.00 #5 
Red Squre large $30.00 #3 

那么,我应该看看什么是有用的预测模型?我应该尝试预测什么算法,比如说最高权重是价格,然后是颜色,然后是大小。如果我想像组合一样预测红色小形状与粉红色小形状相比不太可能更高级别。 (本质上试图结合多个名义值列来进行预测)

回答

0

将组合作为线性方程,并应用蒙特卡罗算法(如遗传算法)来调整方程的参数。


  1. 代码的颜色/形状/尺寸/价格/排名为数字值。

  2. 将组合处理为线性方程,比如a*color + b*shape + c*size + d*price = ranking

  3. 应用遗传算法调谐/ B/C/d,为了使计算rankings是作为更接近地面实况越好。

  4. 最后你得到的公式,你可以用它来:

    1)找到最大的排名通过简单的线性规划;

    2)预测排名通过只分配其他参数。

+0

你可以请看看这个问题吗?http://stackoverflow.com/questions/13983955/how-can-i-use-the-rule-based-learning-algorithms-for-this-example – ExceptionHandler

+0

I我正在努力做到这一点。这个问题我并没有真正找到理想的答案。所以我提出了实际问题与实际样本数据的求助。 – ExceptionHandler

+0

@ExceptionHandler我没有指出这个问题。你已经提出了9个问题,但只接受其中2个:-) – Skyler

2

听起来像你想学习模型,你可以解释为一个人。根据您的排名变量的类型,可能会有许多不同的学习者。

如果排序是分类(例如星星),分类器可能是最好的。 Weka有很多。一些产生人可以理解的模型是决策树学习者和OneR规则学习者。

如果排名是连续的(例如分数),回归可能更合适。合适的算法是例如SimpleLogisticLinearRegression

或者,您可以尝试使用Weka中的任何算法对您的示例进行聚类,然后分析群集。也就是说,群集中的理想示例都是相同(或非常相似)的排名,您可以查看其他属性的值范围并绘制您自己的结论。

+0

非常感谢您的看法。我稍微了解了一点J48,所以我一定会尝试一下。我需要一些关于如何修改数据的建议。现在,我的数据都是名义属性。像黄色,圆形,中等,19.99美元,#458(等级)。那么你如何建议,我尝试去模拟它。或者我应该看到什么样的产出? – ExceptionHandler

+0

'J48'只能处理分类数据,所以原则上不需要修改。将价格转换为数字是有道理的(只需删除$符号)。看到示例排名#458表明分类不是最好的方法,但(没有类)。我建议你尝试回归。根据您选择的算法,您可能需要将数据转换为数字(例如,地图小 - > 0,中 - > 1,大 - > 2等)。 –

+0

如果我使用0,1,2等,算法不会使用字面值而不是将它们用作不同的类? – ExceptionHandler

相关问题