2011-12-12 34 views
4

我一直在负载均衡器后面的Amazon上运行两个相同的中型CPU实例几个月。我注意到负载均衡器习惯于定期声明一个不健康的实例,将实例关闭并替换为定义的AMI的新实例。稳定运行的亚马逊负载平衡器标准是什么?

这在技术上是正确的事情,我只是不明白为什么它偶尔会认为这个实例是不健康的。在过去的3天里,我一直在监视健康检查端口,并且在使用这两个实例的公共DNS时,每60秒检查一次就能正常工作。负载平衡器在此期间宣布了一个不健康的实例3次,并将其替换。这些实例被大量地强制性地满足了我所需要的东西,因此我可以排除这个问题。

对于ELB架构,我知道这在技术上并不重要,但不健康的比率从每周一次变为每天超过一次。启动每个实例花费额外的小时实例成本。如果情况变得更糟,成本将变得不重要,但更重要的是它不会让我相信ELB内部。

这不是问题this one,我的偶尔是失败。有关信息,我使用的是欧盟/爱尔兰数据中心,而我的不健康标准是5分钟内我的端口(8080)出现10次故障(这比我真正想要设置的时间长,我不想要流量进入实例未能得到响应5分钟)。

我知道有人会建议与亚马逊联系,但我没有支持合同,任何尝试过的人都知道我会得到什么样的答案,如果我找到了答案。我真的很喜欢这个东西的想法,它对我来说似乎并不稳定。

+0

您是否使用Auto Scaling? Aditional Instances可能由配置中定义的某些条件启动。如果您安装了“Auto Scaling命令行工具”,请运行as-describe-auto-scaling-groups --headers来列出您的Auto Scaling组。注意最后一列,如:最小尺寸,最大尺寸,希望容量。 –

+0

你在做什么轮询健康检查,即什么在端口8080上响应?我一直只有一个静态文件坐在那里,健康检查实际上只是一个检查,以确保Web服务器(和服务器)启动并运行。此外,您通过ELB获得了多少请求?看起来可能有一些已知的问题在非常高的交通情况 - https://forums.aws.amazon.com/thread.jspa?messageID=261530 – jaminto

+0

是的,我们正在轮询空文件。关于请求的数量 - 有时候是每秒3000个 –

回答

1

让实例处于不健康状态的唯一原因是健康检查失败。确保您的应用程序没有负载峰值,使用一些第三方工具(如nagios,cacti,monit)监视性能,并在此尖峰期间检查系统。

相关问题