我有重复的文本行的文本文件,但我只想要每一个。 想象一下这样的文本文件:提取所有的独特行
AAAAA
AAAAA
AAAAA
BB
BBBBB
BBBBB
CCC
CCC
CCC
我只需要以下四行从中:
AAAAA
BB
BBBBB
CCC
我使用文本编辑器(EmEditor中或记事本+ +),支持正则表达式,而不是一个编程语言,所以我必须使用纯正则表达式。
任何帮助?
编辑: 我检查了hsz提到的另一个线程,我想说清楚这个是不一样的。 尽管两者都需要删除重复的行,但实现它的方式却有所不同。 我需要纯正RegEx,但来自其他线程的最佳答案依赖于特定的Notepad ++插件(甚至不会再有它),所以它甚至不是一个正则表达式解决方案。 那里的第二种情况是一个正则表达式,它可以在Notepad ++上工作,但不能在EmEditor上工作,这也是我需要的。 所以我不认为我的问题是重复那个,虽然那个链接是有用的,所以我感谢hsz。
[在记事本中删除重复的行++](http://stackoverflow.com/questions/3958350/removing-duplicate-rows-in-notepad) – hsz
重复线组合在一起的可能重复?也就是说,该文件可以是AAAA BBBB AAAA BBBB,以便您想让它成为AAAA BBBB? –
Gelbukh的答案:行必须与最初的顺序完全相同。 –