본문 바로가기

bigquery2

[DE-Zoomcamp] 3. Data Warehouse: BigQuery로 OLAP 분석하기 (Partitioning/Clustering/Best Practice/BQML) 이 글은 Data Engineering Zoomcamp의 Module 3: Data Warehouse and BigQuery 를 바탕으로데이터 웨어하우스/BigQuery의 기본 개념부터 비용 모델(스캔 바이트)과 성능 최적화(파티셔닝·클러스터링), 그리고 이와 관련된 테이블 설계 및 실습 예시를 정리한 글입니다. 목차OLTP vs OLAP: 데이터 웨어하우스가 필요한 이유Data Warehouse와 BigQuery 포지셔닝BigQuery 비용 모델(온디맨드 vs 플랫레이트)Partitioning(파티셔닝)Clustering(클러스터링) + 자동 리클러스터링Partitioning vs Clustering 선택 가이드BigQuery Best Practices (비용/성능)BigQuery Internals .. 2026. 2. 9.
[DE-Zoomcamp] 1-2. Terraform으로 GCP 인프라(GCS + BigQuery) 실습하기 이 글은 Data Engineering Zoomcamp의 Module 1: Containerization and Infrastructure as Code를 기반으로, Terraform을 사용하여 GCS Bucket + BigQuery Dataset을 생성/삭제하는 IaC(Infra as Code) 워크플로우를 소개합니다. 목차왜 Terraform인가사전 준비: GCP 인증/권한Terraform 프로젝트 구조예시 코드: GCS Bucket + BigQuery DatasetTerraform 워크플로: init → plan → apply → destroy참고자료/출처1. 왜 Terraform인가 데이터 엔지니어링을 시작하면 가장 먼저 필요한 게 "클라우드 리소스 준비"입니다. GCS 버킷(데이터 레이크)과.. 2026. 1. 25.