Lower your warehouse costs via DuckDB transpilation

Author: Max Halford | Source: https://maxhalford.github.io/blog/warehouse-cost-reduction-quack-mode/ | Published: 2026-03-12


한 줄 요약

SQLGlot 기반 SQL 트랜스파일레이션으로 BigQuery 등 웨어하우스 쿼리를 DuckDB에서 로컬 실행하고, DuckLake로 결과를 관리하여 웨어하우스 컴퓨트 비용을 극적으로 절감하는 “quack mode” 접근법을 제시한다.

핵심 주장/내용

  • 기존 웨어하우스(BigQuery, Snowflake 등)는 데이터 스택에 깊이 통합되어 대체하기 어렵지만, DuckDB 트랜스파일로 컴퓨트만 로컬로 전환할 수 있다
  • DAG를 분석하여 외부 의존성이 있는 루트 스크립트만 웨어하우스에서 실행하고, 나머지는 DuckDB에서 실행하는 하이브리드 접근이 가능하다
  • DuckLake가 DuckDB를 데이터 웨어하우스로 승격시키는 마지막 퍼즐 조각으로, S3/GCS 등 오브젝트 스토리지 기반 저장을 지원한다
  • --quack-push 플래그로 DuckLake 결과를 웨어하우스에 다시 푸시할 수 있어 기존 워크플로우를 유지할 수 있다
  • Iceberg 통합으로 대용량 테이블의 zero-copy 하이브리드 실행도 가능해지고 있다

주요 수치 / 사실

  • lea 오케스트레이터의 --quack 플래그로 구현 (283개 테이블 스크립트 관리)
  • BigQuery 쿼리를 DuckDB로 트랜스파일하여 실행 시 비용 $0.00 (로컬 실행분)
  • 5초 만에 4개 의존성 pull + 1개 테이블 실행 완료 (예시)
  • Greybeam이 이 접근법을 서비스로 판매 중 (현재 Snowflake만 지원)

관련 위키


Source: 원문 보기