2009-11-15 118 views
0

所以我得到了一个DNA序列。统计Python字符串中字母的出现次数

ACCAGAGCGGCACAGCAGCGACATCAGCACTAGCACTAGCATCAGCATCAGCATCAGC 
CTACATCATCACAGCAGCATCAGCATCGACATCAGCATCAGCATCAGCATCGACGACT 
ACACCCCCCCCGGTGTGTGTGGGGGGTTAAAAATGATGAGTGATGAGTGAGTTGTGTG 
CTACATCATCACAGCAGCATCAGCATCGACATCAGCATCAGCATCAGCATCGACGACT 
TTCTATCATCATTCGGCGGGGGGATATATTATAGCGCGCGATTATTGCGCAGTCTACG 
TCATCGACTACGATCAGCATCAGCATCAGCATCAGCATCGACTAGCATCAGCTACGAC 

我需要计算基数。

也出于某种原因,它可以有时它可以在同一个字符串中的大写或小写之间交替。

+0

请用家庭作业标记作业。 – 2009-11-16 03:11:38

+0

这不是hw BRO – y2k 2012-06-17 01:55:59

+0

我认为这个问题非常好。即使这是作业,它也是一个有趣的问题。为什么不在这里问它?从我的+1 – lhk 2012-12-02 12:07:37

回答

7
for base in 'ACGT': 
    print base, thesequence.count(base) + thesequence.count(base.lower()) 
+0

谢谢你全心全意地陛下。 – y2k 2009-11-15 19:02:08

+0

出于好奇,是否有一个原因,你不做这些sequence.lower()。count(base.lower()),而不是?我猜这是为了让它更快,但我不是100%确定。 – 2009-11-15 19:03:47

+0

这种方式不一定更快,但它占用更少的内存。由于DNA序列长**,这可能很重要。 – sth 2009-11-15 19:26:08

相关问题