Part 1 · Ch05 · 토큰 효율
Caching — 비용을 깎는 단일 최대 도구
CLAUDE.md, 시스템 프롬프트, 자주 읽는 큰 파일 — 매 turn 거의 똑같이 들어가는 것들을 다시 계산하지 않는다.
같은 prefix를 반복해서 보내면, Anthropic 서버가 그 prefix의 계산 결과를 캐시해두고, 다음 호출에서는 그걸 재사용한다.
캐시 안 쓰면
매 turn 풀가격으로 다시 계산
× 1.0
캐시 쓰면
한 번만 계산, 이후로는 read 가격
× 0.1