2
我有一个固定宽度的文件,有一些非UTF8字符,我想用空格替换非UTF8字符。如何用空格替换无效的UTF8字符
我试图运行iconv -f utf8 -t utf8 -c $file
但它做的唯一一件事就是删除非UTF8字符。使用iconv无法用空格替换它们。
我想要一个korn shell脚本/ Perl脚本来替换所有非UTF8字符的空格。
我发现这个Perl脚本打印非UTF8字符被发现的行,但我不知道任何关于Perl的东西,使它用空格替换非UTF8。
perl -l -ne '/
^([\000-\177] # 1-byte pattern
|[\300-\337][\200-\277] # 2-byte pattern
|[\340-\357][\200-\277]{2} # 3-byte pattern
|[\360-\367][\200-\277]{3} # 4-byte pattern
|[\370-\373][\200-\277]{4} # 5-byte pattern
|[\374-\375][\200-\277]{5} # 6-byte pattern
)*$ /x or print' FILE.dat
环境AIX