我发现这里安静一些职位提出解决办法使用awk
和sed
,但他们都不似乎做的工作。要么整条线被删除,要么根本没有被删除。我也不是命令行wizzard,我的知识有限,所以我决定在这里寻求帮助。它并不重要的解决方案,无论是awk
,grep
,sed
......老实说,我不能在这种情况下,任何差别,所以这将是任何你觉得它在这种情况下所困扰。如何从包含字符的X个文本文件中删除字?
我所拥有的是几个文件以几百万行,文件/线是这个样子:
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
这也适用于数百万行。我需要做的,是去除50somethingcharactergibberish,只留下shortword。问题也在于没有模式,有时候长字有时以字母开头,有时以数字开头。所以我认为我最终必须对角色进行计数。
是否有始终只有两个文件中的所有行这样的话? – Inian
谢谢你的回复。是的,每条线上只有tho字。冷杉和第二个词之间有一个空格。否则同样的事情上百万次。 – mrBlob