2015-05-29 115 views
1

特定的字符串我有一些数据获取从数据

FON2_ORYSJ|FON2|FON4|LOC_Os11g38270|Os11g0595400 
A1IGU8_ORYSJ|OsF5HL|Os06g0349700 
A1IGU8_ORYSJ|OsF5HL|Os06g0349700 
MTND1_ORYSJ|ARD1|SIP2|LOC_Os10g28350|Os10g0419400|OSJNBa0006I13.11 
MTND1_ORYSJ|ARD1|SIP2|LOC_Os10g28350|Os10g0419400|OSJNBa0006I13.11 
MTND1_ORYSJ|ARD1|SIP2|LOC_Os10g28350|Os10g0419400|OSJNBa0006I13.11 
MTND1_ORYSJ|ARD1|SIP2|LOC_Os10g28350|Os10g0419400|OSJNBa0006I13.11 

我需要单独获取LOC_OS *和OS * ID。

输出应该像

LOC_Os11g38270 
LOC_Os10g28350 
LOC_Os10g28350 
LOC_Os10g28350 
LOC_Os10g28350 

Os11g0595400 
Os10g0419400 
Os10g0419400 
Os10g0419400 
Os10g0419400 

我试图更换|与\吨,然后用grep

grep的-w 'LOC_Os *' 测试> go.txt

,但无法获取这些。

请帮助

回答

0

尝试以下2个命令:

cut -d'|' -f 4 test.dat | grep LOC_Os 

cut -d'|' -f 5 test.dat | grep Os 

说明cut从文件中检索的字段,使用管道(|)作为分隔(-d'|')。第一个命令返回字段4(-f 4),然后在LOC_Os的结果中进行查询。第二个命令返回字段5(-f 5),然后在Os的结果中进行查询。