如何从包含字符的X个文本文件中删除字？

我发现这里安静一些职位提出解决办法使用awk和sed，但他们都不似乎做的工作。要么整条线被删除，要么根本没有被删除。我也不是命令行wizzard，我的知识有限，所以我决定在这里寻求帮助。它并不重要的解决方案，无论是awk，grep，sed ......老实说，我不能在这种情况下，任何差别，所以这将是任何你觉得它在这种情况下所困扰。如何从包含字符的X个文本文件中删除字？

我所拥有的是几个文件以几百万行，文件/线是这个样子：

50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword

这也适用于数百万行。我需要做的，是去除50somethingcharactergibberish，只留下shortword。问题也在于没有模式，有时候长字有时以字母开头，有时以数字开头。所以我认为我最终必须对角色进行计数。

来源

2016-12-23 mrBlob

是否有始终只有两个文件中的所有行这样的话？ – Inian

谢谢你的回复。是的，每条线上只有tho字。冷杉和第二个词之间有一个空格。否则同样的事情上百万次。 – mrBlob

最起码awk，可以为你工作是一样的东西： -

awk '!($1="")' million-line-file

来源

2016-12-23 17:13:58 Inian

非常感谢Inian！这正是我一直在寻找的:)我接受了你的回答，但它没有标记，因为我的声望很低。但正如我所说，这是我寻找的解决方案。再次感谢！ – mrBlob

@mrBlob：通过阅读[什么意思，当答案是“接受”？]（http://stackoverflow.com/help/accepted-answer） – Inian

谢谢伊安，显然我投票而不是接受它。现在接受！ :) – mrBlob

AWK是矫枉过正这种尝试cut

cut -f2 -d ' ' 2col.list > 2ndcol.list

说cut第二场-f2考虑的空间，在输入文件中的每个行字段分隔符-d ' '和第二场重新定向到输出文件

来源

2016-12-24 02:50:04 tomc

如何从包含字符的X个文本文件中删除字？

回答

相关问题