如何判断特定字体是否包含PDF中的特定字符:: API2

我在我的Perl应用程序中使用PDF::API2将OCR 输出嵌入到相应图像的后面，从而允许搜索产生的PDF，因为OCR 输出可以用pdftotext提取。如何判断特定字体是否包含PDF中的特定字符:: API2

目前，只要应用程序在 OCR输出中看到非ASCII字符，就会从PDF核心字体切换到TTF。但是，这个真的很不好，因为核心字体包括大多数西欧字符。 TTF仅仅需要希腊语，俄语，日语，等

我怎样才能知道特定字体是否包含特定字符（包括CMAP表，以便与 pdftotext作品即提取）？

你看过[Font :: TTF :: Font]（http://search.cpan.org/perldoc?Font::TFF::Font）吗？ – tchrist 2012-03-03 02:00:25

您是否尝试过特定于字形的方法？

做不到这一点，也许字形渲染（到一个单独的文件），并测量它？

2012-07-09 13:06:32 LeeGee

回答