2012-08-28 104 views
8

我使用谷歌驱动器API来存储和检索PDF文件。我想用查询参数查询这些文件。谷歌驱动什么是索引大文件的限制?

但是在我开始实施这个之前。我想知道谷歌如何处理大型PDF文件的索引。 (600+页面25Mb +)我想知道基于文本的PDF格式(他们不需要ocr)

我试过一些在驱动器网站上的搜索,它并不总是工作。

我想知道是否有任何限制,它们是什么。

回答

3

根据this page与OCR PDF文件:

图片(.jpg,.gif或.png格式)和PDF文件(.PDF)的最大大小为2 MB。对于PDF文件,我们只在搜索要提取的文本时查看前10页。

而且this page与文本的PDF文件:

您可以搜索PDF和图片文件中的文字是:

  • 键入网络上的谷歌云端硬盘的搜索框中输入查询内容。
  • 打开Goog​​le Drive查看器并使用右上角的搜索框。

从理论上讲,您应该能够搜索任何文本文档或已上传的基于文本的PDF的前100页。您还可以搜索驱动器上任何图像PDF前10页上的文本。

+0

这仅适用于带有ocr的pdf。我想知道基于文本的pdf。 – DavidVdd

+0

好点,我想我已经找到了答案,以及现在在我更新的答案。 –

+0

我认为这100页仅用于pdf查看器搜索。 – DavidVdd