2014-01-20 45 views
0

我有带有核苷酸文本字符串的文件(A,C,G,T)。我想从文本文件中找到特定的字符串并删除它们。从文本文件中删除字符串

例如:

ACTGGGCTGTCCAACTG  
ACTTCTGGGTCGAACTG  
CCCACTTCTGGGTTCAA 

而且我想从所有行只删除该部分ACTGGG 然后我会得到这个字符串的文件:

CTGTCCAACTG  
TCTTCGAACTG  
CCCTCTTTCAA 
+0

可以把它从线条到下一个重叠? –

回答

1

你可以试试:

awk '{gsub(/ACT|GGG/,"")}1' file 
0
perl -pe 's/ACT|GGG//g' your_file 
2

可以帮助你:

sed 's/ACT//g; s/GGG//g' inputFile 

即取代ACTGGG所有出现的一个空字符串。

1

使用sed的

sed -r 's/(ACT|GGG)//g' file