2009-11-23 67 views
2

我正在运行独立的命令行blast来对许多查询序列对核苷酸的大型数据库序列进行比对。我可以修改blastn程序的命令行参数以更改各种参数,例如匹配/不匹配分数。评估BLASTn评分的重要性?

我在想 - 对于blastn输出的“比特分数”,比较相同查询和数据库序列但不同匹配/不匹配参数的比对的比特分数是否有意义?我试图评估爆炸如何以各种参数值表现出来,但我想确保所有事情都在正确的比较。谢谢。

+0

你是如何测量性能的?你说你想测量BLAST的表现如何,但目前还不清楚你的目标是什么。 –

回答

1

我不清楚为什么你认为比较比分可以让你了解BLAST的表现有多好。通常的做法是,在大量的BLAST和其他对齐程序上进行的工作是基于查看本地的,未对齐的对齐,并将这些理论扩展到空隙对齐。特别地,比特得分计算如下:

S' = (lambda * S - ln(K))/ln(2) 

在上式中,K和λ是您的替换矩阵的常数,S是得分(取代和间隙分数的总和),并且S”是比特得分。这意味着您的比特分数肯定会因为改变缺口开放/缺口扩展参数而改变,这意味着您的比较无效。这是一个不幸的结果,即关于缺口排列的理论很少,所以给定系统的最优缺口分数必须凭经验来衡量。

由于比特得分不具有可比性,我建议您根据不涉及比对得分的备用数据集进行评估。例如,如果我对用于比较蛋白质序列的最佳空位开放/空位延伸参数感兴趣,我可以查看已知结构的蛋白质,并根据其能力进行比对来评估每个参数集,从而使结构有意义。这样可以避免完全比较比对分数,这是很好的,因为比较比分本身并不明显。

0

我不确定你能做到这一点。 你真的需要改变匹配/不匹配参数吗?你的目标是什么?