매 턴 = 누적
이전 컨텍스트 + 새 입력 + 새 출력 → 다음 턴의 입력으로 통째로 재투입
이전 컨텍스트 (재입력)
새 사용자 입력
새 Assistant 출력
턴 1
시작
기준 7K
1K
2K
10K
기준선
턴 2
+10K
이전 10K
2K
8K
20K
×2.0
턴 3
+12K
이전 20K
2K
10K
32K
×3.2
턴 4
+15K
이전 32K
3K
12K
47K
×4.7 ⚠️
매 턴 더 많은 토큰 · 더 비싼 호출 · 더 느린 응답
선형이 아니라 점점 가팔라지는 누적 — 출력이 길어질수록 다음 턴이 더 무거워진다
← 이전
☰ 목차 · 05b / 44
다음 →