我正在寻找聚类或机器学习领域内的算法,这将促进或创建一组读数的典型数据。问题是它必须促进时间序列数据;因此一些传统的(k-均值)技术没有那么有用。聚类:查找平均读数
任何人都可以推荐的地方或特定的算法,将提供一个典型的阅读和相对简单的实现(在Java中),操纵和理解?
我正在寻找聚类或机器学习领域内的算法,这将促进或创建一组读数的典型数据。问题是它必须促进时间序列数据;因此一些传统的(k-均值)技术没有那么有用。聚类:查找平均读数
任何人都可以推荐的地方或特定的算法,将提供一个典型的阅读和相对简单的实现(在Java中),操纵和理解?
作为一个想法。尝试将所有数据类型转换为时间,然后您将具有相同类型(时间)的向量,那么任何聚类策略都可以正常工作。
通过转换为时间我实际上意味着我们所了解的任何度量或数据类型都具有一定的时间性质。许多人认为时间不是第四维。时间实际上是零维。即使是没有物理空间的点,也不存在于太空中,存在于时间之中。
距离,重量,温度,压力,方向,速度......我们所做的所有测量都可以转化为时间的某些功能。
我已经在几个项目上尝试过这种方法,并且用真正好的解决方案来回报。
希望,这也可以帮助你。
对于大多数Java中的机器学习问题,weka通常运行得很好。 例如参见:http://facweb.cs.depaul.edu/mobasher/classes/ect584/weka/k-means.html
您是否考虑过k-medoids,其中每个组由**成员**代表,即在你的情况下**代表性时间系列**? –