How We Built High-Precision, Low-Latency Semantic Search in Production
Author: Zepto | Source: Zepto Engineering Blog | Published: 2026-02-16
한 줄 요약
Zepto는 듀얼 인코더 기반 시맨틱 검색 시스템을 약한 지도학습과 합성 데이터로 학습하여, 키워드 검색이 실패하는 쿼리에서 35% 성능 향상을 달성했다.
핵심 주장/내용
- 키워드 기반 검색은 짧고, 오타가 있으며, 어휘 중복이 없는 롱테일 쿼리에서 실패한다
- 듀얼 인코더 아키텍처로 쿼리와 상품 임베딩을 독립적으로 생성하여 의도 인식 검색을 구현했다
- 약한 지도학습(weak supervision)과 합성 데이터를 결합하여 레이블링 비용 없이 학습 데이터를 확보했다
- InfoNCE 손실 함수로 의도 인식 임베딩을 학습하며, 엄격한 레이턴시 제약 하에서 운영한다
- 검색뿐 아니라 광고 유스케이스에도 시맨틱 검색을 확장 적용했다
주요 수치 / 사실
- 영향을 받는 쿼리에서 35% 성능 향상(uplift)
- 다운스트림 랭킹 품질 개선
- 검색 및 광고 두 유스케이스에 동시 적용
관련 위키
Source: 원문 보기