有没有办法在上传文档时执行OCR?Php - 上传文档,docx,pdf - 提取所有内容
我们可以索引整个文档吗?
可以搜索引擎索引整个文件吗?即使用户需要付费查看完整文档?
是否可以将文档显示为预览,只有选定的摘录可见,其余部分模糊且文档格式仍然可见?
我一直试图找到简单的解决方案,使用简单的PHP函数或东西似乎不会像火箭科学来完成这些问题。但在我看来,我看到有人在谈论ApachePOI和Solr Cell以及我不知道的所有这些服务器命令。对于最后一个问题,我只能弄清楚我们可以使用PHPGD并生成带有模糊内容的图像,但如果文档中有格式化的文本,图像和表格等,我不确定如何使其工作。
所以,如果有人有简单的解决方案,或者甚至复杂的解决方案buts with EASY instructions,那么这些都可以。就像“为noobs提取php文件内容”,这将从a-b-c开始。
预先感谢您!
这里有太多可以涵盖一个问题的方法。你应该为每个单独的部分提出一个单独的问题。 – Polynomial 2012-01-28 22:17:58
是否有符合所有需求的标牌解决方案?就像一个简单的comtent提取技术,将完成这一切?除了最后一个课程问题,但这不是主要问题,可以忽略 – salmanhijazi 2012-01-28 22:19:46
不会。你会很幸运找到一个能够同时覆盖多个这样的库的库,特别是因为你问的是多个库文件格式。 – Polynomial 2012-01-28 22:20:15