0
我有PDF文件与乌克兰文字(西里尔字母)。但是,当我复制并粘贴到一些输入栏,我得到的东西旁边:未知的PDF编码
ȿɄɈɇɈɆȱɄɈ-ɋɌȺɌɂɋɌɂɑɇɂɃ ȺɇȺɅȱɁ ȼɂȻȱɊɄɈȼɈȽɈ
没有一个文本检测或转换器并没有帮助我。
它是什么以及如何复制正常的乌克兰文本?
我有PDF文件与乌克兰文字(西里尔字母)。但是,当我复制并粘贴到一些输入栏,我得到的东西旁边:未知的PDF编码
ȿɄɈɇɈɆȱɄɈ-ɋɌȺɌɂɋɌɂɑɇɂɃ ȺɇȺɅȱɁ ȼɂȻȱɊɄɈȼɈȽɈ
没有一个文本检测或转换器并没有帮助我。
它是什么以及如何复制正常的乌克兰文本?
该PDF可能已创建嵌入式字体子集和没有toUnicode
映射。基本上,PDF内容中使用的字符代码被映射到PDF中嵌入的字形,但是没有将这些代码映射到常规Unicode代码,因此复制它们会产生乱码。提取原始内容的唯一方法是使用某种形式的OCR。
这是在Adobe Acrobat或其他工具? – Dai
@Dai我试着用很多应用程序和浏览器打开它。结果是一样的。它看起来不错,但我不能复制它。 –