파트 1 · Ch05 · Agent Guardrails
3-Layer 모델 — 큰 그림
Guardrails는 한 덩어리가 아니라 세 개의 레이어다.
위험 행동 자체가 발생하지 않게 — pre-tool-use hook으로 가로채기
↓
일어난 일을 빠짐없이 남기고, 임계 넘으면 즉시 알림
↓
실패해도 메인 코드·환경에는 안 닿게 — sandbox · worktree · permission mode
세 층이 같이 작동해야 한다. 어느 한 층만으로는 부족하다 — Prevent만 있으면 빠져나간 사고를 못 보고, Detect만 있으면 피해 범위를 못 줄이고, Contain만 있으면 매번 격리 환경을 박살 낸다.