Beyond ETL: The Case for Context

Author: Michel Tricot | Source: https://agentblueprint.substack.com/p/beyond-etl-the-case-for-context | Published: 2026-03-26


한 줄 요약

ETL은 데이터 이동 문제를 해결했지만 의미(meaning) 문제는 해결하지 못했으며, AI 에이전트 시대에는 Context Store를 통해 시맨틱 정의를 사전 구축하고 버전 관리하는 것이 필수 인프라가 되었다.

핵심 주장/내용

  • Ananth Packkildurai의 ECL(Extract, Contextualize, Link) 프레임워크는 ETL의 T(Transform) 단계에서 비즈니스 의미가 소실되는 근본 문제를 정확히 진단하며, AI 에이전트가 잘못된 컨텍스트를 대규모로 증폭시키는 위험을 경고한다
  • Context Store는 새로운 발명이 아니라 Materialized View의 연장선으로, 에이전트라는 새로운 소비자를 위해 시맨틱 정의/엔티티 분류/관계 맵을 사전 복제하고 인덱싱하는 인프라 패턴이다
  • Medallion Architecture의 각 변환 단계(Bronze→Silver→Gold)마다 context erosion이 발생하므로, 의미는 파이프라인과 별도로 메타데이터/리니지/출처 정보로 병행 관리해야 한다
  • 에이전트가 실제로 접근하는 데이터 대부분은 Salesforce, Jira, Slack 등 서드파티 SaaS에 있어 스키마 계약을 강제할 수 없으므로, early binding이 아닌 late binding 기반의 Contextualize 파이프라인이 핵심 경로가 된다
  • Context Store에 필요한 인프라 패턴(증분 복제, 스키마 정규화, 인덱싱, 멀티테넌트 격리, freshness SLA)은 데이터 엔지니어링 커뮤니티가 이미 10년간 구축해온 것이며, 부족한 것은 거버넌스 템플릿이다

주요 수치 / 사실

  • (직접적인 정량 데이터보다 개념 프레임워크 중심의 아티클)
  • Semantic layer 사례: Cube, dbt metrics, Looker LookML 등이 비즈니스 정의를 외부화한 선례
  • 한 팀은 LLM 생성 매핑 로직이 테스트에서는 작동했으나, 커스텀 필드 변경 후 프로덕션에서 1주일간 레코드를 잘못 분류한 사례 언급

관련 위키


Source: 원문 보기