我有一个在AWS中运行的大型基于Web的应用程序,其中包含许多EC2实例。偶尔 - 大约每周两次或三次 - 我收到来自我的Sensu监控系统的警报通知,通知我其中一个实例已达到100%CPU。为什么IOWait中的AWS EC2 CPU使用率瞬间高达100%?
这是通知:
CheckCPU TOTAL WARNING: total=100.0 user=0.0 nice=0.0 system=0.0 idle=25.0 iowait=100.0 irq=0.0 softirq=0.0 steal=0.0 guest=0.0
Host: my_host_name
Timestamp: 2016-09-28 13:38:57 +0000
Address: XX.XX.XX.XX
Check Name: check-cpu-usage
Command: /etc/sensu/plugins/check-cpu.rb -w 70 -c 90
Status: 1
Occurrences: 1
这似乎是一个瞬间发生,CPU进入回落到正常水平秒之内。所以这似乎不应该太担心。但我仍然好奇它为什么会发生。请注意,CPU占用100%IOWaits。亚马逊的监测系统并没有注意到这一点。下图给出了CPU & IOlevels图像在13:38
有趣的是,AWS说告诉我,这种情况将很快退休。可能是两者有关吗?