Part 1 · Ch05 · 토큰 효율

캐시 친화적 prompt 작성법

5분 TTL과 prefix 구조에서 자동으로 따라 나오는 단 하나의 규칙 — 고정 prefix를 앞에, 변하는 부분을 뒤에.
도입 전 — 캐시 깨짐
[system prompt]
[현재 시간: 2026-05-28 14:32:11]   ← 매 turn 바뀜
[CLAUDE.md 1,500줄]
[Second Brain 노드 3개]
[user: 로그인 버그 수정해줘]
한 줄짜리 시간 때문에 CLAUDE.md도 Second Brain도 전부 cache miss — 수만 토큰을 매번 재계산.
도입 후 — 캐시 살림
[system prompt]                    ← 고정
[CLAUDE.md 1,500줄]                ← 고정
[Second Brain 노드 3개]            ← 고정
────────── 캐시 경계 ──────────
[현재 시간: ...]               ← 변동
[user: 로그인 버그 수정해줘]        ← 변동
위 덩어리는 5분 내 다음 호출까지 계속 cache hit. 같은 작업, 토큰 비용 1/10.
이 작은 순서 차이를 plugin의 system prompt 빌더가 알아서 정리해 주면, 팀 전체가 별 노력 없이 캐시를 살린다.