2014-04-01 51 views
3

嗯,我想做一个PDF阅读器,将文本转换为语音,我为.txt文件做了这个,但我很困惑如何将PDF文件转换为TXT文件。如何将PDF转换为android应用程序中的文本?

一些pdf文件被扫描副本如何为他们做?

+1

你无法读取图像。首先,你必须将它们转换为文本。为此,您需要一个OCR软件,它利用AI(人工智能)技术...您确定要将自己置身于此吗?! –

+0

好的,留下一段时间的扫描副本,那么正常的pdf呢。 –

+1

这里有第三方库 - 像[muPdf](http://mupdf.com/docs/how-to-build-mupdf-for-android),只是引用了一个 –

回答

2

要做到这一点,你必须使用的东西,认识到在代码中的文本,根据维基百科:

光学字符识别
光学字符识别,通常缩写为OCR,是 机械或者将打印或打印文本的扫描或拍摄图像 电子转换为机器编码/计算机可读 文本。它被广泛用作从某种 原始数据源,无论是护照文件,发票,银行 声明,收据,名片,邮件或任何数量的打印 记录的数据输入形式。它是数字化打印文本的一种常用方法,以便它们可以进行电子编辑,搜索,更紧凑地存储, 在线显示,并用于机器处理如机器 翻译,文本到语音,关键数据提取和文本挖掘。 OCR 是模式识别,人工智能 和计算机视觉领域的研究。

一些参考:

  1. 有一些可用的教程:http://kurup87.blogspot.nl/2012/03/android-ocr-tutorial-image-to-text.html
  2. 示例应用程序:https://github.com/rmtheis/android-ocrhttps://github.com/GautamGupta/Simple-Android-OCR
  3. 阿比的http://ocrapiservice.com
  4. 图书馆http://www.abbyy.com/mobileocr/android/

如果你不能选择要挑选什么,这里有很多可用的stackoverflow文章,只是谷歌“android ocr stackoverflow”

相关问题