AI-Ready Data

“You don’t ‘upgrade’ analytics-ready data into AI-ready data.” — Modern Data 101


핵심 개념

AI-Ready Data는 모델·에이전트·ML 시스템이 효과적으로 추론할 수 있도록 최적화된 데이터 상태를 말한다. 기존의 analytics-ready data(인간의 의사결정을 위해 압축·집계된 데이터)와는 근본적으로 다른 요구사항을 갖는다.

Analytics-Ready vs AI-Ready

속성Analytics-ReadyAI-Ready
소비자인간 (분석가, 경영진)모델 (LLM, ML, 에이전트)
핵심 질문무슨 일이 있었나?다음에 무엇을 해야 하나?
데이터 처리 방향압축 (variance 제거)확장 (context 보존)
핵심 속성정확성, 집계, 안정성, 설명가능성컨텍스트, 완전성, 적시성, 의미적 풍부함
실패 모드부정확한 숫자 → 신뢰 붕괴불완전한 컨텍스트 → 할루시네이션

AI-Ready Data의 4가지 속성

  1. Context(컨텍스트): 모델은 세상을 경험하지 못하므로, 역사적 상태·사용자 의도·환경 조건·시스템 제약 같은 주변 정보가 필수
  2. Completeness(완전성): 모델은 인간처럼 판단으로 빈 곳을 채우지 못함. 누락 데이터를 “불확실성”이 아닌 “부재”로 처리
  3. Timeliness(적시성): 어제의 진실이 오늘의 부채. 모델 행동을 현재 현실에 고정
  4. Semantic Richness(의미적 풍부함): 관계·계층·의도·제약이 데이터 자체에 명시적으로 인코딩되어야 함

Dashboard Trap

높은 분석 성숙도를 가진 조직이 흔히 빠지는 함정. 대시보드가 신뢰받고 메트릭이 거버넌스되지만, AI가 필요로 하는 variance, edge case, contextual detail이 이미 압축되어 사라진 상태.

“Our data is great, but why doesn’t AI work?”

독립적 성숙도 경로

두 시스템은 수렴하지 않으며 독립적으로 성숙시키되 조정(coordination)해야 한다:

  • 공유 기반: 정확한 이벤트, 신뢰할 수 있는 소스, 보존된 의미
  • 분기점: Analytics는 현실→설명으로, AI는 현실→가능성으로 변환

실무 시사점

  • Semantic Layer와 문서화가 AI-readiness의 기반 (SafetyCulture 사례)
  • Data Governance 레이어가 AI 에이전트의 정확성을 결정 (JET 사례)
  • 이벤트를 먼저 캡처하고, 의미를 보존한 뒤, 분석 뷰를 나중에 도출하는 순서가 중요

연관 개념


Source: AI-Ready Data vs Analytics-Ready Data, The Journey to Agentic BI, Daedalus and the Data Labyrinth