2015-08-25 35 views
-1

我们有一系列带滑行位置的序列。我们希望通过考虑数据行中的顺序模式来对数据进行聚类。 例如: T1,T2,T3,T4是行程,a,b,c,d,e是一组地点。 我们已经是像数据,使用可变长度数据输入和EM算法聚类

  • T1 B C B A d
  • T2一个
  • T3 A B A B A B Cëd
  • T4 B C d C B d℃的

但问题是该数据的长度是不变量。我们如何使用EM对这些类型的数据进行聚类。由于它不接受可变长度的数据,所以我们可以自定义它。 谢谢

回答

1

EM是一般原则。您可以使用它与非常不同的型号

可能最流行的EM模型是高斯混合建模,GMM。

当然,如果你使用协方差,GMM 需要一个固定的维数。

但是,如果您使用其他模型,没有理由不能使用可变长度向量。例如,有EM处理文本数据的变体,文本通常具有不同的长度。