Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees

Author: Lyft Engineering | Source: https://eng.lyft.com/predicting-rider-conversion-in-sparse-data-environments-with-bayesian-trees-07227ff92789 | Published: 2026-03-30


한 줄 요약

Lyft는 위치/시간/수요의 희소한 long-tail 조합에서 표준 ML 모델의 과적합 문제를 해결하기 위해, Gaussian prior와 L2 정규화를 적용한 Bayesian Tree 기반 승객 전환율 예측 모델을 구축했다.

핵심 주장/내용

  • 희소한 컨텍스트 데이터(위치, 시간, 수요의 long-tail 조합)에서 표준 ML 모델은 과적합되어 불안정한 예측을 생성하는 문제가 있다
  • Bayesian Tree는 컨텍스트를 계층적으로 구성하고, 데이터가 풍부한 리프 노드에서는 지역화된 정확도를, 희소한 영역에서는 상위 노드의 안정적인 트렌드로 graceful degradation을 제공한다
  • Gaussian prior와 L2 정규화를 적용하여 희소 리프의 신호와 안정적인 부모 트렌드 간의 균형을 맞춘다
  • Monotonicity 제약 조건을 적용하여 일관되고 해석 가능한 예측을 보장한다

주요 수치 / 사실

  • (원본 접근 불가로 DEW 소개문 기반 — 구체적 수치 없음)

관련 위키


Source: 원문 보기