Pillar II · 본질적 차이
Crappy Output vs Validated Work
agent의 출력물은 두 종류로 갈린다 — 검증 신호의 출처가 결정한다
신뢰 가능성
"동작하는 것 같다"
"동작한다 — 증명됨"
검증 신호 출처
없음 또는 LLM 자기 평가
외부 결정론 시스템
테스트 · 로그 · 렌더링
자기 수정
불가능 — 실패를 감지 못 함
자동 — 실패 신호 → 재시도 → 재검증
6개월 후 상태
누구도 만지지 못함
git diff처럼 검증 가능, 유지보수 가능
⚡ 확률 엔진은 — 자기가 만든 결과를 자기가 평가하면, 그 평가도 같은 확률 분포의 영향을 받는다. 자기 평가는 신뢰할 수 없다.