2014-03-31 57 views
0

我是数据挖掘的新手。我想从我的数据集中挖掘多维和有序的关联规则,例如关联规则算法

if (income => 100)^(priority=>1)^(skill=>technician) then (approve=>prove) 

我学到的是 categorical =技能例如,技术员,管道工或任何文本数据
定量=数字的日期,余额

那么重要的是哪个关联规则算法应该使用?大多数算法是定量的或者是分类的吗?

+0

将'(技能=>技术人员)'看作是一个布尔函数,给出1或0,那么现在就是一个定量评估 – Pyrce

+0

是否有任何关于定量和分类数据关联规则的算法? – user3302521

+0

我上面的评论是通常使用的规则,将分类数据视为布尔匹配或在评估时不匹配 - 这通常以矩阵形式存储,以便在不同类别/元素之间进行快速查询。 – Pyrce

回答

0

我想你是在误解关联规则挖掘的概念。 您的定量数据不能用于关联规则挖掘(正如我理解您的问题)。至少,您无法“调整”数量以适应您的需求,因为关联规则挖掘中的所有内容都是项目(定量或定性)和交易,以便您可以定义相互关联项目的规则。因此,数量成为“固定”项目。注意什么是关联规则挖掘:给定一组包含项目子集的二元属性(项目)和事务集合,您定义了一组规则,这些规则是含义:X - > Y(带有X Y是该组项目的子集,并且也是分离的)。

你可以将规则的含义解释为if,但这只是句法糖。正如我们在关联规则挖掘中所了解的那样,它们并没有定量或定性。只是,属于一个集合的项目以及我们在它们之间定义的关系(含义/规则)。