파트 1 · Ch05 · Token Efficiency
Cost Gate — 사전·실시간 정책
Dashboard는 사후(이미 쓴 비용 표시). Gate는 사전·실시간(예산 초과 직전 신호). 단순한 두 종류면 충분하다.
세션 단위 gate
한 세션이 일정 토큰을 넘으면 경고. session-start hook이 누적 토큰을 추적.
300K tokens 초과 → "이번 세션 비용 $X, 계속 진행하시겠습니까?"
PR 단위 gate
한 PR을 만드는 누적 세션 비용이 임계를 넘으면 라벨/코멘트. CI에서 같은 로직.
PR당 $20 초과 → `cost-flag` 라벨 부착
08 ↔ 10 Guardrails 경계 — 같은 자산, 다른 강도
08 (지금) · 평소 최적화
비용을 줄이고 가시화. 임계 초과 시 경고와 가시화까지만.
10 (다음) · 폭주 방지
사고 방지. 같은 gate에 강제 정지 권한 — 경고가 아니라 세션을 죽인다.
자율성을 죽이는 결정은 10번에서. 이게 8번과 10번의 분업이다.