Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees
Author: Lyft Engineering | Source: https://eng.lyft.com/predicting-rider-conversion-in-sparse-data-environments-with-bayesian-trees-07227ff92789 | Published: 2026-03-30
한 줄 요약
Lyft는 위치/시간/수요의 희소한 long-tail 조합에서 표준 ML 모델의 과적합 문제를 해결하기 위해, Gaussian prior와 L2 정규화를 적용한 Bayesian Tree 기반 승객 전환율 예측 모델을 구축했다.
핵심 주장/내용
- 희소한 컨텍스트 데이터(위치, 시간, 수요의 long-tail 조합)에서 표준 ML 모델은 과적합되어 불안정한 예측을 생성하는 문제가 있다
- Bayesian Tree는 컨텍스트를 계층적으로 구성하고, 데이터가 풍부한 리프 노드에서는 지역화된 정확도를, 희소한 영역에서는 상위 노드의 안정적인 트렌드로 graceful degradation을 제공한다
- Gaussian prior와 L2 정규화를 적용하여 희소 리프의 신호와 안정적인 부모 트렌드 간의 균형을 맞춘다
- Monotonicity 제약 조건을 적용하여 일관되고 해석 가능한 예측을 보장한다
주요 수치 / 사실
- (원본 접근 불가로 DEW 소개문 기반 — 구체적 수치 없음)
관련 위키
Source: 원문 보기