EP212: Data Warehouse vs Data Lake vs Data Mesh
Author: ByteByteGo | Source: ByteByteGo Newsletter | Published: 2026-04-26
한 줄 요약
데이터 저장소 아키텍처의 세 가지 패러다임(Warehouse, Lake, Mesh)의 트레이드오프와 실무 조합 패턴을 비교한다.
핵심 주장/내용
- Data Warehouse: 스키마 선행(schema-on-write), 빠른 쿼리와 일관된 리포트 가능, 새 소스 추가에 노력이 듦
- Data Lake: 원시 데이터를 그대로 저장(schema-on-read), 유연하지만 네이밍·포맷·소유권 규칙 없이는 데이터 늪(swamp)이 됨
- Data Mesh: 데이터 소유권을 도메인 팀에 분산, 공유 표준으로 호환성 유지, 각 팀의 역량과 프로세스가 전제 조건
- 실무에서는 대부분 복합 사용: 대시보드/리포트에 Warehouse, ML 워크로드에 Lake, 조직 규모 확장 시 Mesh 원칙 적용
관련 위키
Source: 원문 보기