EP212: Data Warehouse vs Data Lake vs Data Mesh

Author: ByteByteGo | Source: ByteByteGo Newsletter | Published: 2026-04-26


한 줄 요약

데이터 저장소 아키텍처의 세 가지 패러다임(Warehouse, Lake, Mesh)의 트레이드오프와 실무 조합 패턴을 비교한다.

핵심 주장/내용

  • Data Warehouse: 스키마 선행(schema-on-write), 빠른 쿼리와 일관된 리포트 가능, 새 소스 추가에 노력이 듦
  • Data Lake: 원시 데이터를 그대로 저장(schema-on-read), 유연하지만 네이밍·포맷·소유권 규칙 없이는 데이터 늪(swamp)이 됨
  • Data Mesh: 데이터 소유권을 도메인 팀에 분산, 공유 표준으로 호환성 유지, 각 팀의 역량과 프로세스가 전제 조건
  • 실무에서는 대부분 복합 사용: 대시보드/리포트에 Warehouse, ML 워크로드에 Lake, 조직 규모 확장 시 Mesh 원칙 적용

관련 위키


Source: 원문 보기