Unified Context-Intent Embeddings for Scalable Text-to-SQL
Author: Pinterest Engineering (Keqiang Li, Bin Yang) | Source: Pinterest Engineering Blog | Published: 2026-03-07
한 줄 요약
Pinterest가 10만+ 테이블 환경에서 과거 SQL 쿼리를 의미 기반 임베딩으로 변환하고 거버넌스 인지 랭킹을 결합하여, 분석가의 기관 지식을 검색 가능한 라이브러리로 만든 Analytics Agent 아키텍처.
핵심 주장/내용
- 3단계 임베딩 파이프라인: Domain Context Injection → SQL-to-Text(LLM이 분석 의도를 구조화된 NL로 변환) → Text-to-Embedding
- 구조적 패턴(조인 키, 필터, 집계) + 통계적 시그널(성공률, 사용 빈도, 작성자 전문성) + 거버넌스 메타데이터(테이블 티어, 신선도)를 융합한 거버넌스 인지 랭킹
- Asset-first 원칙: 새 SQL 생성 전에 기존 신뢰 에셋(테이블, 큐레이션 쿼리)을 먼저 발견
- AI 문서화로 수동 문서 작업 ~70% 감소, join-based lineage로 40%+ 컬럼 자동 태깅
- MCP 통합 레이어로 테이블·쿼리·지식 검색 도구를 에이전트에 제공
주요 수치 / 사실
- 100,000+ 분석 테이블, 2,500+ 분석가 대상
- 출시 2개월 만에 분석가 인구의 40% 커버, 사내 에이전트 1위 (2위 대비 10x 사용량)
- AI 테이블 설명의 75%+가 “usable” 이상으로 평가
- Vector DB as a Service(OpenSearch 기반)로 수백만 임베딩 관리, 일간 증분 업데이트
관련 위키
Source: 원문 보기