매 턴 = 누적

이전 컨텍스트 + 새 입력 + 새 출력 → 다음 턴의 입력으로 통째로 재투입
이전 컨텍스트 (재입력)
새 사용자 입력
새 Assistant 출력
턴 1시작
1K
2K
10K기준선
턴 2+10K
2K
8K
20K×2.0
턴 3+12K
2K
10K
32K×3.2
턴 4+15K
3K
12K
47K×4.7 ⚠️
매 턴 더 많은 토큰 · 더 비싼 호출 · 더 느린 응답
선형이 아니라 점점 가팔라지는 누적 — 출력이 길어질수록 다음 턴이 더 무거워진다