蔚蓝云队列的可伸缩性

在当前项目中，我们当前使用8个并行的工作角色机器，它们实际上有点像不同的，而不是azure可能期望的。蔚蓝云队列的可伸缩性

该系统的短概要：

现在回答这个问题：当增加机器数量以将性能提高到1200个调用/秒时，我们经历了Cloud Queue的中断。在同一时刻，80％的机器进程不再处理消息。

在这里，我们有两个问题：

重新启动工人确实有帮助，但很快就会导致同样的问题。我们是否碰到了Cloud Queue的可扩展性的自然结局，并且应该切换到Service Bus？

更新：

我一直没能完全理解这个问题，我在the natual borders of Cloud Queue描述它。

总结：

操作。在我的经验，我已经能够得到更好的原始性能了Azure的云队列比服务总线，但Service Bus具有更好的企业功能（可靠性，主题等）。 Azure云队列应该每个队列最多处理2K /秒。

您也可以尝试分区到多个队列，如果有一些自然的分区键。

确保你的进程没有某种形式的线程死锁是真正的罪魁祸首。您可以通过在队列挂起并试图从队列中提取消息时连接到队列来测试此情况。如果可行的话，这是你的过程，而不是队列。

2016-01-22 09:22:13 Cleverguy25

实际上，更好的性能是我们之所以选择Cloud队列的原因。我们从来没有通过8个流程达到最大8个工人达到2k/s。从我的观点来看，4条消息 - 更糟糕的情况是，只有不到300条电话。我个人认为开放式TCP连接的数量不能由操作系统维护。也很奇怪，根本没有例外。没有消息。 :-(无论如何感谢链接！ –

它花了一些时间来解决这个问题：

首先，存储帐户的使用情况的总结：

当确认存储帐户处于重负载状态时，我们将其分解。

该系统已运行了2周，像魅力一样工作。我们从中学到了几件事：

存储中的异常处理非常糟糕。即使存储帐户被过度使用，我希望某种异常的不只是返回零消息没有任何周边信息这里阅读完整的故事：natural borders of cloud storage scalability

UPDATE：可扩展性有很大影响。您可能对Azure Service Bus: Massive count of listeners and senders感兴趣，以了解一些更多的陷阱。

2016-02-22 08:14:41

回答