Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees

Author: Lyft Engineering | Source: https://eng.lyft.com/predicting-rider-conversion-in-sparse-data-environments-with-bayesian-trees-07227ff92789 | Published: 2026-03-30

한 줄 요약

Lyft는 위치/시간/수요의 희소한 long-tail 조합에서 표준 ML 모델의 과적합 문제를 해결하기 위해, Gaussian prior와 L2 정규화를 적용한 Bayesian Tree 기반 승객 전환율 예측 모델을 구축했다.

핵심 주장/내용

희소한 컨텍스트 데이터(위치, 시간, 수요의 long-tail 조합)에서 표준 ML 모델은 과적합되어 불안정한 예측을 생성하는 문제가 있다
Bayesian Tree는 컨텍스트를 계층적으로 구성하고, 데이터가 풍부한 리프 노드에서는 지역화된 정확도를, 희소한 영역에서는 상위 노드의 안정적인 트렌드로 graceful degradation을 제공한다
Gaussian prior와 L2 정규화를 적용하여 희소 리프의 신호와 안정적인 부모 트렌드 간의 균형을 맞춘다
Monotonicity 제약 조건을 적용하여 일관되고 해석 가능한 예측을 보장한다

주요 수치 / 사실

(원본 접근 불가로 DEW 소개문 기반 — 구체적 수치 없음)

Data Eng Wiki

탐색기

Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees

Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees

한 줄 요약

핵심 주장/내용

주요 수치 / 사실

관련 위키

그래프 뷰

목차

백링크