快速简洁地匹配来自具有匹配第一个字段的文本文件的行的方式。用于匹配具有匹配第一个字段的行的命令行(sed,awk等)
样品输入:
a|lorem
b|ipsum
b|dolor
c|sit
d|amet
d|consectetur
e|adipisicing
e|elit
所需的输出:
b|ipsum
b|dolor
d|amet
d|consectetur
e|adipisicing
e|elit
所需的输出,可供选择:
b|ipsum|dolor
d|amet|consectetur
e|adipisicing|elit
我可以想像很多方法来写这篇文章,但我怀疑有一个聪明的方式来做到这一点,例如,使用sed,awk等。我的源文件大约为0.5 GB。
这里有一些相关的问题,例如“awk | merge line on the basis of field matching”,但是其他问题将过多的内容加载到内存中。我需要一个流媒体方法。
解释为什么这是所需的输出,因为它根本不明显。例如你是否在寻找一个能让你指定b,d和e作为所需键值的工具,或者你在寻找键盘在输入中出现两次还是其他的情况? –
我想合并行匹配的第一个字段。对不起,这不清楚。此外,输入是排序的。 –