2012-02-21 65 views
4

我在我的Perl应用程序中使用PDF::API2将OCR 输出嵌入到相应图像的后面,从而允许搜索产生的PDF,因为OCR 输出可以用pdftotext提取。如何判断特定字体是否包含PDF中的特定字符:: API2

目前,只要应用程序在 OCR输出中看到非ASCII字符,就会从PDF核心字体切换到TTF。但是,这个 真的很不好,因为核心字体包括大多数西欧 字符。 TTF仅仅需要希腊语,俄语,日语, 等

我怎样才能知道特定字体是否包含特定字符 (包括CMAP表,以便与 pdftotext作品即提取)?

+0

你看过[Font :: TTF :: Font](http://search.cpan.org/perldoc?Font::TFF::Font)吗? – tchrist 2012-03-03 02:00:25

回答

相关问题