1

我有~13K个序列,有120个碱基,我想比较它们以发现保守区域,它们之间的平均偏差或非常偏离的异常值。计算许多序列的(平均值)序列偏差

问题是,用这个数量的序列我尝试的东西是不可行的。

所以有人在这个大小做了类似的东西,可以给我一些提示如何实现它?或者,也许只是我应该寻找的一些提示?

回答

2

使用PHYLIP程序包的dnadist程序。您在Biopython库中有一些帮助来处理Phylip对齐格式here