我有带有核苷酸文本字符串的文件(A
,C
,G
,T
)。我想从文本文件中找到特定的字符串并删除它们。从文本文件中删除字符串
例如:
ACTGGGCTGTCCAACTG
ACTTCTGGGTCGAACTG
CCCACTTCTGGGTTCAA
而且我想从所有行只删除该部分ACT
和GGG
然后我会得到这个字符串的文件:
CTGTCCAACTG
TCTTCGAACTG
CCCTCTTTCAA
我有带有核苷酸文本字符串的文件(A
,C
,G
,T
)。我想从文本文件中找到特定的字符串并删除它们。从文本文件中删除字符串
例如:
ACTGGGCTGTCCAACTG
ACTTCTGGGTCGAACTG
CCCACTTCTGGGTTCAA
而且我想从所有行只删除该部分ACT
和GGG
然后我会得到这个字符串的文件:
CTGTCCAACTG
TCTTCGAACTG
CCCTCTTTCAA
你可以试试:
awk '{gsub(/ACT|GGG/,"")}1' file
perl -pe 's/ACT|GGG//g' your_file
使用sed的
sed -r 's/(ACT|GGG)//g' file
可以把它从线条到下一个重叠? –