Feature Store

ML 모델에 제공할 피처를 중앙화하여 저장·제공·관리하는 인프라

핵심 개념

Feature Store는 ML 파이프라인에서 피처의 정의, 계산, 저장, 서빙을 중앙화하는 시스템이다. 온라인(실시간 서빙)과 오프라인(학습 데이터) 간 일관성을 보장하고, point-in-time correct 조회가 핵심 기능이다.

Feature Store 시장은 포인트 솔루션에서 대형 플랫폼으로 통합 중:

대규모 ML 시스템에서 사용되지 않는 피처가 네트워크 대역폭과 비용을 낭비하는 문제를 해결:

시간당 피처 파이프라인의 실전 운영에서 얻은 교훈:

TTL 버퍼링: 온라인 스토어에 2일 TTL로 last-known-good 피처 유지 — 장애 시 graceful degradation
계층화된 알림: Tier 0(피처 누락/손상, ~-2% GMV), Tier 1(24시간+ 지연, ~-1% GMV), Tier 2(24시간 미만 지연)
SLO 기반 관리: 코어 테이블+피처 모델+인제스천 99.9% 성공, 엔드투엔드 60분 미만
핵심 교훈: “느려지는 것”은 알림이 발생하지 않는 장애 모드 — 갱신 주기, E2E 레이턴시, 런타임 추세를 명시적으로 모니터링해야 함

긴 사용자 행동 history를 직접 서빙하는 대신, 무거운 시퀀스 모델링을 오프라인에서 한 번 수행해 고정 길이 임베딩으로 증류하고 다수 온라인 모델이 dense feature로 재사용하는 “one producer, many consumers” 패턴:

2계층 시스템: 큰 오프라인 모델이 긴 history를 읽어 user embedding emit, 다수 작은 온라인 모델이 일반 feature로 소비(transformer로 재작성 불필요)
multi-sequence → unified single-sequence 진화(Indeed): 모든 이벤트를 시간순 단일 타임라인 + event-type embedding → 한 transformer가 cross-event 패턴(impression→click→apply) attend → 다운스트림 lift 약 2배
self-attention denoising: 긴 history의 지속 패턴 증폭, 일회성 행동 down-weight(handcrafted aggregate보다 우수)
일일 임베딩 갱신: 모델은 수개월 고정, 일일 batch inference로 임베딩만 갱신 → feature store
Pinterest의 User-Sequence 플랫폼은 이 시퀀스 데이터를 “하나의 정의, 여러 런타임”으로 일관 생성하는 인프라 측면을 다룬다 — 두 글은 상보적(증류 방법 vs 시퀀스 공급 인프라)
트레이드오프: 오프라인-온라인 split은 일부 최적성 희생(attention이 scoring 시점 target job에 조건화 안 됨)하나 지연·비용 이득이 큼. staleness는 day-over-day 코사인 유사도로 모니터링