我是一个完整的Python noob,所以请原谅我简单的问题。我正在尝试编写一个脚本,它将查找与ATxxxCA,ATxxxxCA,ATxxxxxCA或ATxxxxxxCA匹配的大字符串中的所有序列,其中x可以是任何字符。当ATxxxCA模式匹配时,我会希望脚本捕获匹配ATxxxCA周围的前10个和后10个字符。例如,结果可能是这样的:aaaaaaaaaaATxxxCAbbbbbbbbbbpython len函数问题
我试图做这样开始的脚本:
SeqMatch = input("enter DNA sequence to search: ")
for s in re.findall(r'AT(.*?)CA', SeqMatch):
if len(s) is < 10:
print(s)
else:
print('no sequence matches')
我好像做错了什么,我如果循环?谁能帮忙?提前致谢!
我不得不指出BioPython - http://biopython.org/ DIST/docs/tutorial/Tutorial.html#htoc16 – 2011-04-15 22:08:39
执行时会发生什么?你期望发生什么? – Bittrance 2011-04-15 22:08:53
不得不指出正则表达式: http://regexpal.com/ 很适合开发/调试正则表达式 – 2011-04-15 22:17:55