How We Built High-Precision, Low-Latency Semantic Search in Production

Author: Zepto | Source: Zepto Engineering Blog | Published: 2026-02-16


한 줄 요약

Zepto는 듀얼 인코더 기반 시맨틱 검색 시스템을 약한 지도학습과 합성 데이터로 학습하여, 키워드 검색이 실패하는 쿼리에서 35% 성능 향상을 달성했다.

핵심 주장/내용

  • 키워드 기반 검색은 짧고, 오타가 있으며, 어휘 중복이 없는 롱테일 쿼리에서 실패한다
  • 듀얼 인코더 아키텍처로 쿼리와 상품 임베딩을 독립적으로 생성하여 의도 인식 검색을 구현했다
  • 약한 지도학습(weak supervision)과 합성 데이터를 결합하여 레이블링 비용 없이 학습 데이터를 확보했다
  • InfoNCE 손실 함수로 의도 인식 임베딩을 학습하며, 엄격한 레이턴시 제약 하에서 운영한다
  • 검색뿐 아니라 광고 유스케이스에도 시맨틱 검색을 확장 적용했다

주요 수치 / 사실

  • 영향을 받는 쿼리에서 35% 성능 향상(uplift)
  • 다운스트림 랭킹 품질 개선
  • 검색 및 광고 두 유스케이스에 동시 적용

관련 위키


Source: 원문 보기