2014-03-04 84 views
0

我正在开发一个项目,该项目要求我将打印参考书目(近14000项)与数字目录/数据库进行比较。是否有可能 1.扫描参考书目​​, 2.通过OCR程序运行, 3.(可选)将扫描的文件转换为电子表格 4.将该信息与库目录进行比较,即查看是否参考书目中的项目出现在目录集合中?已扫描的文档和数据库查询

这将大大减少此项目目前需要的时间。

回答

0

是的,这是绝对有可能的。

这是一个非常有趣的项目,不寻常,需要一些MacGyver。

您描述的步骤是正确的。请记住,为了使OCR结果的最大自动化计划不完美,所以您的搜索算法应该具有一定的灵活性和模糊性,足以应对OCR偶尔出现的错误,但足以确保不会导致误报。