2016-12-23 66 views
0

我发现这里安静一些职位提出解决办法使用awksed,但他们都不似乎做的工作。要么整条线被删除,要么根本没有被删除。我也不是命令行wizzard,我的知识有限,所以我决定在这里寻求帮助。它并不重要的解决方案,无论是awkgrepsed ......老实说,我不能在这种情况下,任何差别,所以这将是任何你觉得它在这种情况下所困扰。如何从包含字符的X个文本文件中删除字?

我所拥有的是几个文件以几百万行,文件/线是这个样子:

50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 

这也适用于数百万行。我需要做的,是去除50somethingcharactergibberish,只留下shortword。问题也在于没有模式,有时候长字有时以字母开头,有时以数字开头。所以我认为我最终必须对角色进行计数。

+0

是否有始终只有两个文件中的所有行这样的话? – Inian

+0

谢谢你的回复。是的,每条线上只有tho字。冷杉和第二个词之间有一个空格。否则同样的事情上百万次。 – mrBlob

回答

0

最起码awk,可以为你工作是一样的东西: -

awk '!($1="")' million-line-file 
+0

非常感谢Inian!这正是我一直在寻找的:)我接受了你的回答,但它没有标记,因为我的声望很低。但正如我所说,这是我寻找的解决方案。再次感谢! – mrBlob

+0

@mrBlob:通过阅读[什么意思,当答案是“接受”?](http://stackoverflow.com/help/accepted-answer) – Inian

+1

谢谢伊安,显然我投票而不是接受它。现在接受! :) – mrBlob

0

AWK是矫枉过正这种尝试cut

cut -f2 -d ' ' 2col.list > 2ndcol.list 

cut第二场-f2考虑的空间,在输入文件中的每个行字段分隔符-d ' '和第二场重新定向到输出文件

相关问题