2017-03-18 47 views
0

我有PDF文件与乌克兰文字(西里尔字母)。但是,当我复制并粘贴到一些输入栏,我得到的东西旁边:未知的PDF编码

ȿɄɈɇɈɆȱɄɈ-ɋɌȺɌɂɋɌɂɑɇɂɃ ȺɇȺɅȱɁ ȼɂȻȱɊɄɈȼɈȽɈ 

没有一个文本检测或转换器并没有帮助我。

它是什么以及如何复制正常的乌克兰文本?

+0

这是在Adobe Acrobat或其他工具? – Dai

+0

@Dai我试着用很多应用程序和浏览器打开它。结果是一样的。它看起来不错,但我不能复制它。 –

回答

1

该PDF可能已创建嵌入式字体子集和没有toUnicode映射。基本上,PDF内容中使用的字符代码被映射到PDF中嵌入的字形,但是没有将这些代码映射到常规Unicode代码,因此复制它们会产生乱码。提取原始内容的唯一方法是使用某种形式的OCR。