我试图从文本文件中滤除包含除字母之外的任何字符的所有单词。我已经浏览了stackoverflow和其他网站,但是我发现的所有答案都是针对不同场景的,而且我无法将其复制到我的目的中;我最近才开始学习Unix工具。摆脱文本文件中包含特殊字符的所有单词
这里是我想要做的一个例子:
输入:
@derik I was there and it was awesome! !! http://url.picture.whatever #hash_tag
输出:
I was there and it was awesome!
所以标点符号的话可以留在文件中(其实我需要他们留下来),但任何具有特殊字符(包括标点符号)的子字符串都需要修剪掉。这可能可以用sed完成,但我无法弄清楚正则表达式。帮帮我。
谢谢!
你有'punctuation'字符不属于名单中删除? – anubhava
*特殊字符*是什么意思? – melpomene