2012-10-03 51 views
0

我正在开发一个网站,其中我的客户想要将其客户的发票(PDF)上传到网络服务器上的目录。然后,当客户登录时,他们可以看到他们的所有发票并按日期排序。快速检索目录中的特定文件

由于他每个月都必须上传约1000张发票,因此我正在设法考虑完成此操作的最佳方法。他不想逐个上传发票。他宁愿只是一次上传100个。我在想,每张发票都需要在文件名中包含客户的帐号和日期以帮助完成此过程。但即使如此,如果有数以千计的发票,那么一旦所有这些发票上传完毕,可能都必须将文件路径自动链接到数据库。

任何人都有一个好主意,想让这个项目运行?

+0

上传本身是如何工作的?您不能指望他手动上传1000个文件... – arkascha

+0

他们会通过FTP将发票上传到预定义的目录。 – dstahc

+0

那么,如果它真的必须是第70个FTP协议以及所有令人讨厌的副作用,那么至少应该添加一些加密技术,以便每个人都不能读取登录信息。所以请尝试使用FTPS或更好的SFTP。但后者需要不同的客户端和服务器软件。然而,上传完成后,尽量避免客户自己触发导入过程。你必须要求hm使用两个不同的应用程序,那么你自己编写一个小的“导入客户端”(并使用http进行上传和通信)可能更有意义。 – arkascha

回答

0

将所有“尚未卸载”的PDF文件放入目录中。从PDF中获取帐号,发票号码和日期(OCR,或者如果它们仍包含文本)并使用它们将条目添加到数据库中。

假设您没有将PDF加载到数据库中,请在数据库插入后将它们移动到其永久位置。

更棒的是 - 您是不是首先从数据库生成PDF文件?添加这个档案步骤作为PDF生成过程的一部分。

+0

客户端将通过FTP将PDF文件上传到网络服务器。 所以你说的是我有一个脚本,它读取PDF中的文本?也许我可以读取元数据呢? – dstahc

+0

另外,我想客户端首先会将PDF上传到一个目录,然后触发一个进程来搜索目录中所有新上传的PDF文件? – dstahc

+0

那么这些PDF文件的“元数据”包含哪些内容?你从哪里得到它? – arkascha