今日主题:Ingress TLS 证书续期
场景描述:证书过期风险导致 HTTPS 访问不稳定
本篇内容采用生产场景方式组织,覆盖告警识别、根因定位、快速处置、复盘优化四个步骤,适合Linux运维与SRE岗位训练。
一、故障现象与根因
故障现象:证书过期风险导致 HTTPS 访问不稳定
根因分析:证书到期监控缺失,自动续期任务未纳入巡检
二、定位流程图
三、关键排障命令
kubectl get certificate -A
kubectl describe certificate growedu-tls -n ingress
kubectl get challenge -A
kubectl logs -n cert-manager deploy/cert-manager --tail=200
四、优化策略与指标目标
使用 cert-manager 自动续期并增加 30 天到期提醒
目标:证书续期成功率 100%,零线上中断
五、实操训练清单
1. 梳理全部域名证书清单并打标签
2. 配置续期失败告警到飞书群
3. 每周抽样验证证书链完整性
六、官方文档参考
咨询方式:苏州育成教育 李老师 18068438616(Linux 运维 / ETL 课程咨询)。