假设我有如下所述的数据。数据挖掘情况
上午11时user1的刷
11:05 AM user1的准备Brakfast
11:10 AM USER1吃早餐
11:15 AM USER1洗浴
11:30为user1办公室
离开12PM user2 Brush
1 2:05 PM user2的准备Brakfast
12:10 PM user2的吃早餐
12:15 PM user2的洗浴
12:30 PM user2的离开办公室
11AM用户3洗浴
11 :05AM user3 Prep Brakfast
11:10 AM user3 Brush
11:15 AM用户3吃早餐办公
11:30 AM用户3离开
12PM USER4洗浴
12:05 PM USER4准备Brakfast
12:10 PM USER4刷
12:15 PM user4吃早餐
12:30 PM user4离职
这些数据告诉我不同人的日常生活。从这些数据看来,user1和user2的行为类似(尽管他们执行活动的时间有所不同,但他们遵循相同的顺序)。出于同样的原因,User3和User4的行为类似。 现在我必须将这些用户分组到不同的组中。在这个例子中,group1-user1和USer2 ...跟着group2,包括user3和user4
我应该如何处理这种情况。我正在尝试学习数据挖掘,这是一个我认为是数据挖掘问题的例子。我试图找到解决方案的方法,但我想不出一个。我相信这些数据有其中的模式。但我无法想到可以揭示它的方法。 另外,我必须将这种方法映射到我拥有的数据集上,这非常巨大,但与此类似:)数据是关于记录一次发生事件的日志。我想找到代表相似事件序列的组。
任何指针,将不胜感激。
谢谢..我想我得到了你所解释的。按照您解释的方式进行聚类应该是一个好主意。我会努力的。非常感谢你的帮助:) – user722856