我有一个制表符分隔的数据框,最后一列包含嵌套信息,即'|'分隔。需要注意的是所有行维持由“REP =”后面这种嵌套的括号结构将嵌套列拆分为多列UNIX
col1 col2 col3 col4
ID1 text text text...REP=(info1|info2|info3)
ID2 text text text...REP=(info1|info2|info3)
我想处理此最后一列,使得括号内的所有信息是新列:
col1 col2 col3 col4 newcol newcol2 newcol3
ID1 text text text info1 info2 info3
ID2 text text text info1 info2 info3
我会认为一个AWK命令会很有用,但是在适当地构造这个命令时遇到了麻烦。任何帮助将非常感激。
REP之前的那些点是否真的存在,还是代表更多列? –
...代表col4中发生在'REP ='之前的其他文本 – AMS
“REP”之前是否存在选项卡? –