我有一个pdf文件,并希望执行经典的adobe查找功能(ctrl + f)。我的问题是,事实证明,它从来没有找到任何匹配,而我可以选择文本并完美地复制/粘贴,所以我不认为这是一种字体编码问题。PDF查找功能不起作用
仅供参考这是一个PDF,我从互联网上下载(不是由我自己创建的),当打开文档属性时,它没有一个单一的描述。文档限制摘要选项全部设置为“允许”,但文档装配,页面抽取和签名设置为“不允许”。
在此先感谢
我有一个pdf文件,并希望执行经典的adobe查找功能(ctrl + f)。我的问题是,事实证明,它从来没有找到任何匹配,而我可以选择文本并完美地复制/粘贴,所以我不认为这是一种字体编码问题。PDF查找功能不起作用
仅供参考这是一个PDF,我从互联网上下载(不是由我自己创建的),当打开文档属性时,它没有一个单一的描述。文档限制摘要选项全部设置为“允许”,但文档装配,页面抽取和签名设置为“不允许”。
在此先感谢
基础问题是信息字典的PDF被打破:
1270 0 obj<</Taylor and Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H-
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦”Qarmæ qq»ã
h
W<:Ê+Úã
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj
“kaî¼Y:/Producer>>endobj
它看起来完全是乱码。
我修补的文件有这个对象仅包含一个空的字典:
1270 0 obj<<>>endobj
nd Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H-
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦”Qarmæ qq»ã
h
W<:Ê+Úã
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj
“kaî¼Y:/Producer>>endobj
现在的Adobe Reader允许我适当地搜索PDF。
很有趣的是看到了这样的问题,其中一个破碎的PDF允许多少ADOBE READER代码工作的,并导致只有特定的,看似无关,功能失效
如果PDF结构的其余部分是正确的,则* * *建议在创建它的软件中出现某种错误。但是..没有'/ Info'字段,我们不知道它是什么! – usr2564301 2014-09-29 10:35:11
*如果PDF结构的其余部分是正确的* - 至少iText在修补程序后成功解析它(实际上我最初尝试使用iText解析原始PDF文本,并且生成的'InvalidPdfException'指向我指向已损坏的** Info * * 间接宾语)。 *创建它的软件中的错误* - 也可能是一个软件*操纵*由其他软件创建的中间PDF。 – mkl 2014-09-29 14:25:18
谢谢mkl!但是,我怎样才能应用这个补丁?我如何访问这个信息词典文件? – chiva 2014-09-30 07:12:20
请分享问题的PDF。 – mkl 2014-09-26 10:18:55
我该如何上传? – chiva 2014-09-26 10:20:22
除非你自己创建了PDF(你说你没有创建PDF),或者你编写了Adobe Acrobat Reader(你可能没有这么做),但是这个问题与SO没有关系。 ..说:你能把这个PDF文本复制到一个纯文本文件吗?如果不是,文本是不可读的。 – usr2564301 2014-09-26 10:29:32