DataJunction as Netflix’s Answer to the Missing Piece of the Modern Data Stack
Author: Netflix Tech Blog | Source: Netflix Tech Blog (Medium) | Published: 2026-02-01
한 줄 요약
Netflix가 팀 간 메트릭 정의 불일치 문제를 해결하기 위해 만든 오픈소스 시맨틱 레이어 DataJunction은 그래프 기반 메타데이터 모델과 SQL 생성 엔진으로 메트릭을 컴퓨테이션에서 분리한다.
핵심 주장/내용
- 메트릭 정의를 컴퓨테이션(쿼리 실행)과 분리하는 그래프 기반 메타데이터 모델 채택
- SQL 생성 엔진을 통해 여러 실험 플랫폼에서 메트릭을 표준화
- 신규 팀 온보딩 타임라인을 대폭 단축하고 비즈니스 버티컬 전반으로 확장
- LLM 통합을 지원하여 감사 가능한 메트릭 리니지 추적 가능
- 오픈소스로 공개하여 커뮤니티 기여 생태계 구축
주요 수치 / 사실
- 팀 온보딩 타임라인 유의미하게 단축 (구체적 수치는 원본 접근 불가로 미확인)
- Unity Catalog와 비슷한 카탈로그-중심 거버넌스 접근
관련 위키
Source: 원문 보기