关于这里的第一个问题 - 我已经搜索了一些答案,但到目前为止已经空了。从文件中删除带有日语字符的行
我有一个多行文本文件,我正在清理。其中一部分是删除包含日文字符的行。我一直在使用sed
进行其他操作,但在这种情况下它不起作用。
我的印象是,使用-r
开关和\p{Han}
正则表达式可以工作(从查看这种类型的其他问题),但它在这种情况下不起作用。
这里是我的测试字符串 - 运行这将返回完整的字符串,并不会像我期待的那样过滤出JP字符。
echo 80岁返老还童的处女: 第3话 | sed -r "s/\\p\{Han\}//g"
我错过了什么吗?我应该使用另一个命令吗?
你知道,你在你的文件中其他人物除了日语和ACSII字符? – syadav
是的。该文件是从亚马逊刮来的书名清单,所以在那里有一点大杂烩。 – Elliotpage