(下面是我无法粘贴我看到的字符,BB
将表示一个字符是数字0080的正方形,后面跟着一个数字为0094的正方形)。难以用sed代替的字符
我在ISO文件编辑器中看到这个带有âBB
而不是–
的ISO-8859-15编码的字幕文件。
如果我用cat
读取文件,破折号会正常显示,但如果我照原样使用该文件,它将在视频字幕上显示—
。
我试图与SED替代,没有成功:
sed 's/âBB/–/g' thisfile > correctedfile
sed 's/—/–/g' thisfile > correctedfile
我第一次尝试它的命令行和编号方框不出现的话,我有一个脚本试了一下。
我甚至试图与
sed 's/â../–/g' thisfile > correctedfile
作弊,并没有工作。
cat
和sed
看到它完美的 - ,所以我想
sed 's/–/–/g' thisfile > correctedfile
,但它也不能工作。
然后我试着recode iso885915..utf8 thisfile
,反之亦然,什么也没有。
如果我在kate
中定期查找并替换,它会修复它。但是由于问题出现在我想用命令行中的for; do; done
循环解决的其他文件中,但为此我需要知道如何解决其中的一个问题。
为什么这些解决方案不起作用,我错过了什么以及如何使它工作?
请尝试查看sed所见的文件。使用'sed -n l file',然后在替代命令中使用这些值。 – potong
'cat'和'sed'完全看作是 - ,然后我尝试了'sed's/-/-/g'',但它也不起作用。 – Strapakowsky
我不使用sed,但是这是怎么回事:http://www.cyberciti.biz/faq/unix-linux-sed-ascii-control-codes-nonprintable/? –