2011-07-31 25 views
2

使用数据挖掘,我们能够使用像关联等技术在大量数据中找到有用的模式,并且必须存在一些开源工具(这是一些例子?)。关于数据挖掘的基本查询

这是基于拉取还是基于推送?我的意思是,我们是否提供数据集以及特定查询作为数据挖掘引擎的输入,并且它提供了我们的答案(如在SQL中)或者我们只提供大型数据集作为引擎的输入,并且它自己查找模式(我们从来不知道它存在和/或我们不能为此提出查询),因此我们并没有真正从中得到任何具体的查询,它推动了我们的模式。

维基百科文章的一些快速阅读并没有明确地澄清我的疑惑。

回答

2

由于开放源码看看Weka

关于推拉的事情,好吧,这两者都有点。但并不那么简单。你一定在找东西。例如。如果你正在寻找集群,有无监督算法,这将给你一个最小指导的答案。

实践中,如果您了解所分析的数据,并且正在查看有意义的规律和模式,则事情更有意义。

与Weka一起玩会让你更好地了解各种可能性。

0

PythonR是在数据挖掘领域非常受欢迎的其他伟大的开源工具。