← 전체 목록
📊

Google BigQuery

분석서버리스 데이터 웨어하우스

아키텍처 다이어그램

데이터 로드스트리밍 삽입포함시각화예약 실행ML 학습🪣Cloud Storage📡Pub/Sub📁Dataset📊Table📈Looker StudioScheduled Query🤖BQML

점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다

왜 필요한가요?

데이터가 수억~수십억 행이 되면 일반 DB에서 GROUP BY 쿼리를 돌리는 데 몇 시간이 걸립니다. 분석 전용 클러스터를 만들자니 설정, 튜닝, 유지보수가 또 다른 짐이 됩니다.

안에서 어떻게 동작하나요?

BigQuery는 데이터를 컬럼 단위로 저장하고, 쿼리를 실행하면 내부에서 수천 개 워커에 자동 분산합니다. 사용자는 SQL만 작성하면 되고, 서버 프로비저닝이나 인덱스 설계를 신경 쓸 필요가 없습니다.

무엇과 헷갈리나요?

BigQuery와 Cloud SQL은 둘 다 SQL을 사용하지만 목적이 다릅니다. Cloud SQL은 트랜잭션 처리(OLTP)에, BigQuery는 분석 쿼리(OLAP)에 최적화되어 있습니다. 행 단위 CRUD가 주 업무면 Cloud SQL, 대규모 집계와 리포트가 주 업무면 BigQuery입니다.

왜 이런 방식이 등장했나요?

예전에는 분석을 위해 Hadoop 클러스터를 구축하고 MapReduce를 작성해야 했습니다. Google이 내부에서 쓰던 Dremel 기술을 서비스화한 것이 BigQuery이고, 클러스터 관리 없는 분석이라는 패러다임을 열었습니다.

언제 쓰나요?

BI 대시보드, 로그 분석, 데이터 레이크 쿼리, 애드혹 분석처럼 대량 데이터를 집계해야 할 때 적합합니다. 실시간 트랜잭션이나 행 단위 업데이트가 빈번한 워크로드에는 맞지 않습니다.

비즈니스 인텔리전스로그 분석머신러닝실시간 분석
Official Docs

더 깊게 보기

현재 페이지의 개념 설명을 본 뒤 공식 문서로 바로 이동합니다.

GCP