所以我有一个包含大量行的文本文件。每行是一个没有间距的长字符串,但是,该行包含多条信息。该程序知道如何区分每行中的重要信息。该程序确定该行的前4个数字/字母与特定仪器一致。这是文本文件的一个小例子部分。查找部分匹配的行
例如文本文件
1002IPU3...
POIPIPU2...
1435IPU1...
1812IPU3...
BFTOIPD3...
1435IPD2...
正如你所看到的,也有包含1435这个文本文件,它与特定的仪器重合之内两行。然而这些线不相同。如果有同一个电台的重复(即有两个1435 *电台),我正在使用的节目无法进行计算。我需要找到一种方法来搜索我的文本文件,并确定是否存在代表文件中站点的部分字符串的任何重复项,以便我可以删除一个或两个重复项。如果我可以让BASH脚本输出包含重复项的行数以及重复行的内容,我们将不胜感激。我认为可能有一个简单的方法来做到这一点,但我一直无法找到任何这样的例子。感谢您的帮助。
'sort -k1.1,1.4 file.txt | uniq -Dw4'为你工作? – heemayl
所以我试着你的命令,我得到了'>> $ sort -k1.1,1.4 text.file | uniq -Dw4 \ uniq:非法选项 - D \ 用法:uniq [-c | -d | -u] [-i] [-f fields] [-s chars] [input [output]]'我做错了什么?只是好奇,如果你遇到这样的事情... – Jon
对不起,我还是新来堆栈溢出,有时我的意见看起来很奇怪。当我使用“\”时,只是要注意那是一条新线。 – Jon