1

我有某种对象模型,我需要过滤和排序它的某些属性的节点。存在哪些自动化系统来生成和选择与我想要的相关的对象模型的属性? (我故意是抽象的和非特定的)如何过滤/排序/排列对象模型节点?

我在考虑一种类似于垃圾邮件过滤器或监督分类系统的系统,它给出了一个示例数据集,它标识了查找感兴趣节点的规则。不过,我正在寻找一个更通用的系统,因为它不需要关于对象模型的任何设计时间信息。它应该像电子邮件上的垃圾邮件过滤器,代码库中的bug查找器,新闻组中的感兴趣过滤器或社交网站上的机器人帐户查找器一样工作平等。只要它可以通过反射探索对象模型,并给予一组“有趣”的节点,它应该能够找到可以找到更多类似它们的节点的规则。

+1

BTW:我不会感到惊讶,如果没有很好的解决方案存在。 – BCS 2009-08-13 17:45:57

回答

1

这是极不可能的,有一个单一的自动分类系统,它可以做所有你是问。此外,我相信这个bug发现者申请属于这种系统的范围之外,因为这是在该领域被成功地用于各地句法分析,数据流分析,以及高度定制的周边软件错误问题的其他算法的方法主要是旋转的方法。虽然机器学习研究正在那里进行,但是这个领域的分类系统大多被用来扩充而不是替代分析方法(据我所知)。

对于大多数不平凡的分类问题,精心选择和问题表征的细化,通常需要以获得通过机器学习有用和有效的结果。简单地使用现有的“原始”数据对象模型而没有对状态空间进行某种特定的转换,往往会导致输入数据值分布的不完全覆盖和/或学习分类器的泛化不佳。此外,正在使用的机器学习方法特有的其他参数可能需要反复试验以获得给定问题的体面结果。并不是所有的方法都有这样的参数,但是很多都是如此,比如神经网络,遗传算法,贝叶斯推理方法等。

你所要求的是一种几乎通用的机器学习方法,它不是当前存在的东西。我能看到的最可行的替代办法是:(1)发现的不同问题的一个子集针对这不会是性能/复杂性所需要的水平,或(2)创建一个使用不只是一个分类技术,而是一个系统有一个不同方法的工具箱,它可以针对给定问题自动进行测试,然后使用在监督学习制度下产生最佳分类结果的方法。后者仍然是一个非常有挑战性的问题,但它并没有消除如何表示/转换数据模型的状态空间的问题。

+0

最后一句“如何表示/转换数据模型的状态空间”。实际上描述了我想知道的有关解决方案的问题。 – BCS 2010-06-15 18:16:23

+0

状态空间模型问题的一种可能性是扩展“工具箱”概念,并有各种不同的表示方式自动测试出来。这可以包括(1)无变换[这可能工作确定对于一些类型的离散值或文本数据的],(2)概念簇或自然语言的本体,(3)粗编码表示为数字数据,等。这些也可能是一种通用的方案,它提供了一种很好的机会来以一种有用的方式分割国家空间,以便更容易地学习模式,但缺乏更多定制方法的能力。 – 2010-06-15 18:57:09