파트 1 · Ch05 · Oncall Agent
What is Oncall Agent
production signal에 자동으로 1차 대응하는 agent. 진단·정보 수집·추천 액션을 정리해서, 임계를 넘으면 사람에게 escalate한다.
책임 1
1차 진단
어떤 서비스, 어떤 에러, 영향 범위
책임 2
정보 수집
관련 log, 최근 deploy, 비슷한 과거 사고
책임 3
사람 호출 결정
confidence 충분 → hotfix 후보 제안
부족 → 즉시 escalate
🩺
자율적으로 코드를 patch해 prod에 푸시하는 게 아닙니다 — 이 agent는 응급실 분류 간호사(triage nurse). 환자를 받고, 분류하고, 의사를 호출합니다. 수술은 안 합니다.