2014-09-26 34 views
0

我有一个pdf文件,并希望执行经典的adobe查找功能(ctrl + f)。我的问题是,事实证明,它从来没有找到任何匹配,而我可以选择文本并完美地复制/粘贴,所以我不认为这是一种字体编码问题。PDF查找功能不起作用

仅供参考这是一个PDF,我从互联网上下载(不是由我自己创建的),当打开文档属性时,它没有一个单一的描述。文档限制摘要选项全部设置为“允许”,但文档装配,页面抽取和签名设置为“不允许”。

在此先感谢

+0

请分享问题的PDF。 – mkl 2014-09-26 10:18:55

+0

我该如何上传? – chiva 2014-09-26 10:20:22

+0

除非你自己创建了PDF(你说你没有创建PDF),或者你编写了Adobe Acrobat Reader(你可能没有这么做),但是这个问题与SO没有关系。 ..说:你能把这个PDF文本复制到一个纯文本文件吗?如果不是,文本是不可读的。 – usr2564301 2014-09-26 10:29:32

回答

1

基础问题是信息字典的PDF被打破:

1270 0 obj<</Taylor and Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H- 
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+ 
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i 
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦”Qarmæ qq»ã 
h 
W<:Ê+Úã 
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj 
“kaî¼Y:/Producer>>endobj 

它看起来完全是乱码。

我修补的文件有这个对象仅包含一个空的字典:

1270 0 obj<<>>endobj 
nd Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H- 
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+ 
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i 
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦”Qarmæ qq»ã 
h 
W<:Ê+Úã 
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj 
“kaî¼Y:/Producer>>endobj 

现在的Adobe Reader允许我适当地搜索PDF。

很有趣的是看到了这样的问题,其中一个破碎的PDF允许多少ADOBE READER代码工作的,并导致只有特定的,看似无关,功能失效

+0

如果PDF结构的其余部分是正确的,则* * *建议在创建它的软件中出现某种错误。但是..没有'/ Info'字段,我们不知道它是什么! – usr2564301 2014-09-29 10:35:11

+1

*如果PDF结构的其余部分是正确的* - 至少iText在修补程序后成功解析它(实际上我最初尝试使用iText解析原始PDF文本,并且生成的'InvalidPdfException'指向我指向已损坏的** Info * * 间接宾语)。 *创建它的软件中的错误* - 也可能是一个软件*操纵*由其他软件创建的中间PDF。 – mkl 2014-09-29 14:25:18

+0

谢谢mkl!但是,我怎样才能应用这个补丁?我如何访问这个信息词典文件? – chiva 2014-09-30 07:12:20