摘要
- 告警现象: 核心 OLAP 节点 Node Exporter Down,日志报
broken pipe。- 排查路径: 从网络连通性验证到具体采集器性能分析,逐步缩小范围。
- 根因定位:
processes采集器在遍历海量进程时耗时过长(>30s),导致抓取超时。- 解决方案: 禁用高开销采集器,恢复监控稳定性。
Kubernetes Node Exporter Down 告警排查实战:隐形杀手 Processes 采集器
Harbor 连接 PostgreSQL 报错 SQLSTATE XX000 排查指南
在维护 Harbor 镜像仓库时,我们可能会遇到 Harbor 核心服务无法连接数据库的情况,导致无法推送镜像或查看项目。本文将针对一个特定的 PostgreSQL 连接错误进行排查分析。
解决 Harbor 推送 S3 报错 412 Precondition Failed
在云原生环境中,使用 Harbor 对接对象存储(如 AWS S3、MinIO、Ceph RGW、Aliyun OSS 等)是常见的做法。然而,在推送大镜像时,有时会遇到 412 Precondition Failed 错误,导致推送失败。本文将详细分析该问题的原因并提供解决方案。
