2014-11-17 60 views
0

我正在尝试计算输入字符串和给定的字符串集合之间的百分比相似度。我看过使用汉明距离和levenshtein距离的例子。但这些只考虑了两次伤害。一组字符串之间的百分比相似度

我的问题:可以一次计算多个刺激的上述情况吗? (我有一组存储的字符串,我得到一个新的输入刺痛,我想知道新的刺激有多相似,或者匹配90%的刺痛)。我相信海明距离是合适的,因为所有的字符串都是等长的。

例如:假设输入:一件T T A C G(C T)

​​

虽然有很多类似的问题的答案,我一直没能找到一个考虑到这一点。也许有人可以帮忙。

在此先感谢!

+0

为什么你把sql标签? –

回答

0

您可以使用此:levenshtein

检查文档有例子,希望它的帮助你。

相关问题