2014-02-18 27 views
0

我想提取我的iOS应用程序的PDF文档文本从PDF阅读的文本,我使用CGPDFScanner .. 我使用这些链接参考:无法在IOS

在上述两个环节中规定的方法的工作进行一些简单(Programming in objective c)类型的PDF的..但是,当我尝试提取PDF文本,如那些在“Head First”系列中,我获得了垃圾值。请建议我一些解决方案,这将适用于所有类型的pdf

+0

@BradLarson为什么反对投票? – ViruMax

+0

我没有对你的问题投票,只是编辑它来删除链接到一个盗版电子书。 –

回答

-1

尝试使用http://fastpdfkit.com/,这是我用过的最好的pdf阅读器库之一。

+0

我见过fastpdfkit,但我不能使用它,因为它没有使用CGPDFDictionary,我想通过使用它。我也尝试过PDFKitten,但这个库也无法正确扫描pdf文本。建议对此问题提供一些替代方法(代码片段)。 – ViruMax

+0

嗯,我没有遇到这个问题。目前我没有任何选择,但会让你知道,如果我找到任何。 –

0

如果您使用的是PDFKitten,那么它可能是CMap解析问题。我已经解决了这个问题,并发现几乎每一个pdf文件的搜索都很顺利。

+0

如果使用PDFKitten,则PDF有ToUnicodeMapping时会出现很多问题。它解析CMap是完全错误的。它在解析时抛弃了大部分映射。如果您可以解决这个问题,您将能够正确搜索PDF格式,因为您将使用适当的文本进行有效利用。 – Swaroop