2012-01-16 47 views
5

我不知道如何在pdf中搜索希腊字母。我怎样才能做到这一点?理想情况下,我可以在PDF阅读器软件包中执行此操作。在PDF文档中搜索希腊字符

从我见过的论坛贴文中,希腊字母超出了pdf规范中包含的标准unicode字符。

+0

为什么你不能检查字母是否匹配[\ u0391- \ u03A9,\ u03B1- \ u03C9]? – 2012-01-16 14:06:54

+0

当我从xpdf使用pdftotext命令时,希腊字符以拉丁字符出现。我认为这是因为utf-8中的pdftotext输出不包含希腊字母[链接](http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues)什么pdf2text输出设置可以我使用那将包括希腊字符? – Chogg 2012-01-24 19:28:19

+0

尽管如此,我会在诸如pdf-XChange viewer之类的程序中搜索这些字符。我只能在搜索框中输入我输入的字母,所以我不知道如何表明我想搜索unicode编码而不是构成unicode编码的字符(例如\ u0391),如果您明白了吗。 – Chogg 2012-01-24 19:31:17

回答

2

我已经弄清楚我做错了什么,而且它非常基础。

我可以通过使用字符映射或切换到希腊字母键盘(如αβγ)来搜索希腊字母。

这通常会找到希腊字符。许多PDF虽然不能正确识别希腊字符,而是采用与其他形状的字符相近似的gobbledygook。这大概取决于PDF是如何制作的。