2015-09-01 68 views
1

给定每个包含Y值的X个集合,我如何找到最常用的集合? (不确定如果常见的是正确的字)找到最常见的一组值

作为一个例子我有6组,每组含5个值:

A B C D E 
A A D L G 
G A B D F 
A A I F G 
A A D F G 
A B E F G 

我将如何去寻找其涉及其他人的大部分集,作为:

A A D F G 

这种统计是否有名字?

+0

你有什么相似的标准? – yossico

+0

我想检索与其他集合最相似的集合。这是你的意思是相似性标准? – Luis

回答

0

对于每个集合,计算其自身与其他集合之间Levenshtein距离的总和。 总和最小的集合是与其他集合最相似的集合。您可以选择使用动态编程来提高程序的效率。

+0

这绝对是朝着正确方向迈出的一步,我将用于下一步,然后找到最不常见的设置。 – Luis

+0

这只是具有最大总和的集合。 – happymeal

+0

你会如何忽略Levenshtein距离序列的顺序? – Luis