我试图在DataDog中创建一个警报,当磁盘性能降低我们的机器时,它会提醒我们。如何组合datadog io指标以识别磁盘瓶颈?
作为一项业务需求,我会说,如果IO在30分钟内接近饱和(超过90%),应该触发警报。
以下是当前的指标集被记录: sys.cpu.iowait system.io.avg_q_sz system.io.avg_rq_sz system.io.await system.io.r_await system.io.r_s system.io.rkb_s system.io.rrqm_s system.io.svctm system.io.util system.io.w_await system.io.w_s system.io.wkb_s system.io.wrqm_s
它可以使用任何公式来组合这些,包括SUM和AVG值。
谢谢!你的回答非常明显,但我一直在寻找一段时间没有运气 – mdegges