我有一个包含类似数据的文件:搜索的行中的特定字段文件
0000380000000101
0000650000000201
0000650000000301
0000650000000401
0001000000000101
0001000000000201
....等等。我想处理这些数据,让我得到这样
000065 0000000201 0000000301 0000000401
000100 0000000101 0000000201
由于000065的输出重复3次,在输出我想000065只出现一次,而在每个条目对应的字节只要发生000065应打印。因为,000038只有一次,我不想要这个输出。在这个例子中,数据(即000065或000038碰巧是3个字节,尽管它可以是任何长度,而像0000000401之后的字节将是固定长度,即5个字节)。我想要最好使用shell脚本或c。请让我知道我该怎么做。 awk可以在这里有所帮助吗? 任何帮助将不胜感激。下面是实际的文件所采取的数据,我想的过程:
0000000000000101
0000000000000201
0000000000000301
0000000000000401
0000380000000101
0000650000000201
0000650000000301
0000650000000401
0001000000000101
0001000000000201
0001000000000301
0001000000000401
0038d30000000101
00652e0000000201
00652e0000000301
00652e0000000401
008d750000000101
008d750000000201
008d750000000301
008d750000000401
0100010000000101
0100010000000201
0100010000000301
0100010000000401
01008d0000000101
01008d0000000201
01008d0000000301
01008d0000000401
01a8c00000000101
01a8c00000000201
01a8c00000000301
01a8c00000000401
0264010000000101
0264010000000201
0264010000000301
0264010000000401
0615df0000000101
0615df0000000201
0615df0000000301
0615df0000000401
07dd940000000101
07dd940000000201
07dd940000000301
07dd940000000401
0900000000000101
0900000000000201
0900000000000301
0900000000000401
15dfc70000000101
15dfc70000000201
15dfc70000000301
15dfc70000000401
1ecf090000000101
[UUOC](https://en.wikipedia.org/wiki/Cat_(Unix)#Useless_use_of_cat)alert! – 2012-03-13 12:50:08
你是一位awk高手! – 2012-03-13 12:51:39
在Mac上没有帮我工作 – anubhava 2012-03-13 12:55:52