Prometheus Operator 常用指标
Prometheus Operator 安装完成后会有很多默认的监控指标,一不注意就大量的报警产生,所以我们非常有必要了解下这些常用的监控指标,有部分指标很有可能对于我们自己的业务可有可无,所以可以适当的进行修改,这里我们就来对常用的几个指标进行简单的说明。
1. Kubernetes 资源相关
1.1 CPUThrottlingHigh
关于 CPU 的 limit 合理性指标。查出最近5分钟,超过25%的 CPU 执行周期受到限制的容器。表达式:
| |
相关指标:
- container_cpu_cfs_periods_total:容器生命周期中度过的 cpu 周期总数
- container_cpu_cfs_throttled_periods_total:容器生命周期中度过的受限的 cpu 周期总数
