我想根据第一列的相等性折叠行。然后将第二列的内容添加到新的折叠表中,以逗号分隔并添加额外空间。另外,如果第二列的内容相同,则折叠它们,也就是说,如果输出文件中出现两次“非剧毒”,则只显示一次。基于相同的键折叠行
我在这里很新,请解释如何运行它。希望任何人都可以帮助我!
输入(制表符分隔):
HS372_01446 non-virulent
HS372_01446 non-virulent
HS372_01446 lung
HS372_00498 non-virulent
HS372_00498 non-virulent
HS372_00498 non-virulent
HS372_00498 lung
HS372_00498 lung
HS372_00954 jointlungCNS
HS372_00954 non-virulent
HS372_00954 non-virulent
HS372_00954 moderadamentevirulenta(nose)
HS372_00954 lung
希望的输出(制表符分隔):
HS372_01446 non-virulent, lung
HS372_00498 non-virulent, lung
HS372_00954 jointlungCNS, non-virulent, moderadamentevirulenta(nose), lung
为什么有些你的输出行(最后1)在逗号和其他字符(前2)之后是否有空格? –
嗨,埃德,这是一个错误。逗号后加空格。 – biotech