外观
一句话答案
排查标准流程:止血(降级/限流/回滚)→保留现场(dump/日志)→定位根因→修复→复盘改进。
核心要点
排查流程: 止血(降级/限流/回滚) → 保留现场(dump/日志) → 定位 → 修复 → 复盘
| 问题 | 工具 | 典型根因 |
|---|---|---|
| CPU 100% | top+jstack | 死循环/正则回溯 |
| 内存持续涨 | jmap+MAT | ThreadLocal泄漏 |
| 接口超时 | Arthas | 慢SQL/第三方超时 |
追问与易错
追问方向:
- 怎么保留现场?
- 止血和修复优先级?
- 复盘会怎么开?
易错点:
- ❌ 从来没出过线上问题——不可信
- ❌ 只说问题不说改进
💡 记忆锚点
线上救火五字诀:止(止血优先)→ 留(保留现场dump)→ 查(定位根因)→ 修(修复上线)→ 盘(复盘防再犯),先灭火再查原因,别让房子烧完了才去找火源。