2017-04-14 59 views
2

我在我的Django项目中使用最新的稳定芹菜(4)与RabbitMQ。芹菜击败有时停止工作

RabbitMQ在本地网络内的独立服务器上运行。并周期性地停下来发送任务给工作人员,没有任何错误,只有重新启动才能解决问题。

工人中没有例外(签入日志&也我用Sentry来捕捉异常)。它只是停止发送任务。

服务配置:

[Unit] 
Description=*** Celery Beat 
After=network.target 

[Service] 
User=*** 
Group=*** 
WorkingDirectory=/opt/***/web/ 
Environment="PATH=/opt/***/bin" 
ExecStart=/opt/***/bin/celery -A *** beat --max-interval 30 

[Install] 
WantedBy=multi-user.target 

是否有可能解决这一问题?或者有什么好的选择? (克朗似乎不是最好的解决方案)。

+0

也许你应该尝试使用strace的或东西,如果你can'f得到的东西整理一下,芹菜节拍可以通过OOM被杀。系统监视器上有什么异常?内存使用情况? – pingz

回答

3

你的描述听起来很像这个开放的错误:https://github.com/celery/celery/issues/3409

有很多的细节都有,但高层次的错误描述是,如果到RabbitMQ的连接丢失,它是无法重新连接。

不幸的是,我看不出有谁明确地解决了这个问题。

您可以通过调试这个使用这个启动:

ExecStart=/opt/***/bin/celery -A *** beat --loglevel DEBUG --max-interval 30