Your Agents Need Runbooks, Not Bigger Context Windows
Author: Ben Lorica | Source: Gradient Flow (Substack) | Published: 2026-02-10
한 줄 요약
AI 에이전트의 진정한 병목은 컨텍스트 윈도우 크기가 아니라 구조화된 절차적 메모리(런북)의 부재이다.
핵심 주장/내용
- 대규모 컨텍스트 윈도우는 연산 비용이 입력 길이에 따라 이차적으로 증가하며, 집중된 짧은 스니펫이 긴 문서보다 정확도가 2배 높다 (“lost-in-the-middle” 효과)
- RAG는 사실 검색에는 뛰어나지만 멀티스텝 워크플로우를 보존할 수 없으며, 상태 유지 시스템도 운영 태스크의 일관성 요구를 충족하지 못한다
- Context File System은 비싼 추론과 운영 지식 저장을 분리하여, 성숙한 엔지니어링 팀의 런북 문서화 방식을 미러링한다
- 런북 기반 접근법은 반복 실행 시 토큰 소비를 90% 이상 절감하며, 가변 비용을 재사용 가능한 자산으로 전환한다
- 모델 독립적 표준 코드로 프로시저를 저장하고, 실행 추적을 통한 감사 가능성을 보장한다
주요 수치 / 사실
- 집중된 스니펫이 긴 문서 대비 정확도 2배 향상
- 반복 실행 시 토큰 소비 90% 이상 절감 가능
- 1,000번째 실행도 첫 번째와 동일한 비용 발생 (기존 방식의 문제)
관련 위키
Source: 원문 보기