The Model is the Easy Part: Building the LLM Platform at Whatnot

Author: Stas Sajin, Faithful Alabi, Peiyun Zhang, Peicheng Yu | Source: Whatnot Engineering | Published: 2026-04-15

한 줄 요약

LLM 프로덕션 플랫폼의 핵심은 모델 호출이 아닌 velocity(빠른 반복), trust(품질 측정), reliability(안정성) 세 축을 강화하는 인프라 구축이다.

“모델 호출은 쉬운 부분” — 실제 난제는 비결정적 출력, 약한 ground truth, 의도치 않은 방향으로의 시스템 이탈
Velocity: PM/Ops도 프롬프트 실험 가능. Post-exposure logging으로 두 variant가 같은 출력을 낼 때 exposure 미집계 → 10x+ 빠른 반복
Trust: LLM-as-a-judge 캘리브레이션 워크플로우로 도메인 전문가가 evaluator를 직접 교육, 프로덕션 드리프트 사전 감지
Reliability: 멀티 프로바이더, fallback, caching, rate limiting, guardrails를 플랫폼 레벨에서 기본 제공
기존 데이터 인프라(통합 코드베이스, 분석 싱크, 로깅)가 빠른 플랫폼 구축의 기반