2013-07-01 44 views
6

我试了几个小时才找到this问题的解决方案。显然,不幸的是我没有成功。一个非常棘手的问题。 与纯sed色谱柱复杂转座


实例(从AWK问题):

  • 输入:
 
aaa 111  
aaa 222 
aaa 333 
bbb 444 
bbb 555 
ccc 666 
  • 输出:
 
aaa 111,222,333 
bbb 444,555 
ccc 666 

  • 输入
 
APM00065101435 189 
APM00065101435 190 
APM00065101435 191 
APM00065101435 390 
190104555 00C7 
190104555 00D1 
190104555 00E1 
190104555 0454 
190104555 0462 
APM00065101435 391 
APM00065101435 392 
  • 输出
 
APM00065101435 189,190,191,390 
190104555 00C7,00D1,00E1,0454,0462 
APM00065101435 391,392 

我有什么企图?我的一些非工作的例子:

 
sed -nr '1{h;b};H;x;/(\S+).*\n\1.*\'/M{x;b};s/.*\'//m;s/\n\S*\s*/,/g;s/,$//;p' file 
sed -nr '1{h;b};H;x;h;s/(\S+).*\n(\S+).*\'/\1\n\2/m;/(\S+)\n\1\'/M{$!b;g;bk};g;s/\n.*\'//m;:k;s/^\S+\s//2mg;s/\n/,/g;p;x;s/.*\n//;h;$l' file2 
sed -nr 'H;g;s/(\S+)\s.*/\1/gm;/(\S+)\n\1\'/M{$!b;g;bk};g;1d;s/\n.*\'//m;:k;s/\n\S+\s/,/2g;s/\n//;p;g;s/\n.*(\n.*)$/\1/;h' file2 

感谢您阅读此。

+0

呃......这*可能*是可能的......但是我当然不会试图浪费我的时间来判断它是否存在!为什么你想要一个纯粹的sed解决方案?这个问题对于awk来说很简单......为什么要让自己的生活变得更难? –

+0

在'awk'或'perl'中的解决方案将更具可读性,可维护性并且会让您梦想独角兽!只为独角兽人做(或等到[potong](http://stackoverflow.com/users/967492/potong)醒来)! –

回答

5

这可能会为你工作(GNU SED):

sed -r ':a;$!N;s/^(([^ ]+).*)\n\2/\1,/;ta;P;D' file 

或者如果你喜欢:

sed -r ':a;$!N;s/^((\S+\s).*)\n\2/\1,/;ta;P;D' file 

该读2号线到模式空间,每一行的开头比较如果它们是相同的,用逗号代替第一行的开头,然后重复。如果行不匹配,则打印出第一行。

+0

非常感谢,波东。你再次帮助我。我非常感谢你,谢谢。如果可以的话,我会付给你一笔赏金! – captcha