寻找与RabbitMQ的经验,尤其是在使用心脏起搏器和DRDB HA配置,在这里推荐:http://www.rabbitmq.com/pacemaker.htmlRabbitMQ在生产中的稳定性(使用DRBD和Pacemaker)?
的DRBD部分尤其让我感到紧张,所以我在这里希望有人有现实世界的经验分享。
寻找与RabbitMQ的经验,尤其是在使用心脏起搏器和DRDB HA配置,在这里推荐:http://www.rabbitmq.com/pacemaker.htmlRabbitMQ在生产中的稳定性(使用DRBD和Pacemaker)?
的DRBD部分尤其让我感到紧张,所以我在这里希望有人有现实世界的经验分享。
大部分时间都在使用。但是,在处理DRBD时,您必须特别注意击剑(裂脑)。在生产系统中,手动解决这类问题总是很痛苦。
我们未能在主/从(多状态RA)中运行RabbitMQ。我们认为我们会提高可用性。我们现在回到单个实例。如果其他人有几个并发运行的RabbitMQ实例的经验,并支持一个非常棒的主实体,
我发现在有问题的情况下缺乏调试Pacemaker的工具是部署到现场系统的一大障碍...... Pacemaker“思考”或做什么并不总是很清楚。不幸的是,hb_report是不够的。
希望这有助于
D.
我们尝试了主/从配置为好,但它变得难以维持所有实例最新无需停机。相信我,你想更新RabbitMQ。在RabbitMQ本身或Erlang中总会出现一些错误。
我们在日志中每年发生大约100次崩溃,而没有任何有意义的解释。错误日志只有通用的“启动时出错”,而且几乎就是这样。有时它不会在崩溃后启动,而且大多数时候,唯一的解决方案是从所有实例中删除所有持久性消息,以便队列状态在集群中同步。其他时候,它会在启动后立即崩溃,并且只有在多次重复尝试后才能正确加载。这意味着在使用主/从时没有增加可靠性。至少在我们的案件中没有。 (RabbitMQ 3.5.3,Erlang 18.0)
它适用于生产,但只适用于在日志或数据库中的某处保留消息的副本,以及在发生严重崩溃后能够快速恢复的地方。