Your Agents Need Runbooks, Not Bigger Context Windows

Author: Ben Lorica | Source: Gradient Flow (Substack) | Published: 2026-02-10


한 줄 요약

AI 에이전트의 진정한 병목은 컨텍스트 윈도우 크기가 아니라 구조화된 절차적 메모리(런북)의 부재이다.

핵심 주장/내용

  • 대규모 컨텍스트 윈도우는 연산 비용이 입력 길이에 따라 이차적으로 증가하며, 집중된 짧은 스니펫이 긴 문서보다 정확도가 2배 높다 (“lost-in-the-middle” 효과)
  • RAG는 사실 검색에는 뛰어나지만 멀티스텝 워크플로우를 보존할 수 없으며, 상태 유지 시스템도 운영 태스크의 일관성 요구를 충족하지 못한다
  • Context File System은 비싼 추론과 운영 지식 저장을 분리하여, 성숙한 엔지니어링 팀의 런북 문서화 방식을 미러링한다
  • 런북 기반 접근법은 반복 실행 시 토큰 소비를 90% 이상 절감하며, 가변 비용을 재사용 가능한 자산으로 전환한다
  • 모델 독립적 표준 코드로 프로시저를 저장하고, 실행 추적을 통한 감사 가능성을 보장한다

주요 수치 / 사실

  • 집중된 스니펫이 긴 문서 대비 정확도 2배 향상
  • 반복 실행 시 토큰 소비 90% 이상 절감 가능
  • 1,000번째 실행도 첫 번째와 동일한 비용 발생 (기존 방식의 문제)

관련 위키


Source: 원문 보기