2013-05-30 44 views
0

我有关于特定服务器端功能的问题。履带式服务器端

我有一个服务器(Linux)与PostgreSQL数据库(服务器端开发的Python)。 我想创建一个系统,定期(每天一次......也许在一夜之间)删除数据库中的所有过期信息。

完成此操作的最佳方法是什么?

将此系统称为“爬虫”是否正确?

回答

1

我建议您使用crontab作为调度目的。它是Linux环境中事实上的调度标准,而且非常灵活。

至于删除..根据您的具体需求,我认为存储过程可能是要走的路。 PostgreSQL是模块化的,因此您可以使用其内置的脚本语言(PL/pgSQL),但您也可以使用Python,C,Tcl和其他支持的语言。

要从控制台在服务器上执行存储过程,您可以使用psql,这是基于控制台的客户端,用于基于postgres的系统。它能够运行用户命令作为参数或从文件完成脚本而无需用户交互。

我认为“Crawler”用于以自动方式检索数据的应用程序,并且由于您要删除它们,因此这可能不是调用它的最佳方式。总结一下:创建一个存储过程来执行数据维护(如果这可以通过SQL命令实现,那么你甚至不需要深入学习PL/pgSQL),然后用正确的参数调用psql在你的crontab中自动运行它。