← 전체 목록
📊
Google BigQuery
분석서버리스 데이터 웨어하우스
▶아키텍처 다이어그램
점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다
왜 필요한가요?
데이터가 수억~수십억 행이 되면 일반 DB에서 GROUP BY 쿼리를 돌리는 데 몇 시간이 걸립니다. 분석 전용 클러스터를 만들자니 설정, 튜닝, 유지보수가 또 다른 짐이 됩니다.
안에서 어떻게 동작하나요?
BigQuery는 데이터를 컬럼 단위로 저장하고, 쿼리를 실행하면 내부에서 수천 개 워커에 자동 분산합니다. 사용자는 SQL만 작성하면 되고, 서버 프로비저닝이나 인덱스 설계를 신경 쓸 필요가 없습니다.
무엇과 헷갈리나요?
BigQuery와 Cloud SQL은 둘 다 SQL을 사용하지만 목적이 다릅니다. Cloud SQL은 트랜잭션 처리(OLTP)에, BigQuery는 분석 쿼리(OLAP)에 최적화되어 있습니다. 행 단위 CRUD가 주 업무면 Cloud SQL, 대규모 집계와 리포트가 주 업무면 BigQuery입니다.
왜 이런 방식이 등장했나요?
예전에는 분석을 위해 Hadoop 클러스터를 구축하고 MapReduce를 작성해야 했습니다. Google이 내부에서 쓰던 Dremel 기술을 서비스화한 것이 BigQuery이고, 클러스터 관리 없는 분석이라는 패러다임을 열었습니다.
언제 쓰나요?
BI 대시보드, 로그 분석, 데이터 레이크 쿼리, 애드혹 분석처럼 대량 데이터를 집계해야 할 때 적합합니다. 실시간 트랜잭션이나 행 단위 업데이트가 빈번한 워크로드에는 맞지 않습니다.
비즈니스 인텔리전스로그 분석머신러닝실시간 분석
Official Docs
GCP더 깊게 보기
현재 페이지의 개념 설명을 본 뒤 공식 문서로 바로 이동합니다.