DataJunction as Netflix’s Answer to the Missing Piece of the Modern Data Stack

Author: Netflix Tech Blog | Source: Netflix Tech Blog (Medium) | Published: 2026-02-01


한 줄 요약

Netflix가 팀 간 메트릭 정의 불일치 문제를 해결하기 위해 만든 오픈소스 시맨틱 레이어 DataJunction은 그래프 기반 메타데이터 모델과 SQL 생성 엔진으로 메트릭을 컴퓨테이션에서 분리한다.

핵심 주장/내용

  • 메트릭 정의를 컴퓨테이션(쿼리 실행)과 분리하는 그래프 기반 메타데이터 모델 채택
  • SQL 생성 엔진을 통해 여러 실험 플랫폼에서 메트릭을 표준화
  • 신규 팀 온보딩 타임라인을 대폭 단축하고 비즈니스 버티컬 전반으로 확장
  • LLM 통합을 지원하여 감사 가능한 메트릭 리니지 추적 가능
  • 오픈소스로 공개하여 커뮤니티 기여 생태계 구축

주요 수치 / 사실

  • 팀 온보딩 타임라인 유의미하게 단축 (구체적 수치는 원본 접근 불가로 미확인)
  • Unity Catalog와 비슷한 카탈로그-중심 거버넌스 접근

관련 위키


Source: 원문 보기