← 전체 목록
📈

Google Cloud Monitoring

관리클라우드 인프라 관측성

아키텍처 다이어그램

수집수집수집시각화임계값 감시실패 시 알림🖥️Compute Engine🚀Cloud Run☸️GKE📊Metrics📈Dashboard🔔Alerting PolicyUptime Check

점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다

왜 필요한가요?

서비스를 배포하면 지금 정상인지, 느려지고 있는지, 디스크가 차고 있는지를 알 방법이 필요합니다. 문제가 터지고 나서야 알게 되면 이미 사용자 경험이 손상된 뒤입니다.

안에서 어떻게 동작하나요?

Cloud Monitoring은 GCP 서비스에서 메트릭을 자동 수집하고, 대시보드에 시계열로 보여줍니다. 알림 정책에 조건(예: CPU > 80% 5분 이상)을 설정하면, 조건 충족 시 Notification Channel(Slack, 이메일, PagerDuty)로 알립니다. Uptime Check은 외부에서 주기적으로 서비스에 요청을 보내 가용성을 확인합니다.

무엇과 헷갈리나요?

Cloud Monitoring과 Cloud Logging은 둘 다 관측성 도구이지만 역할이 다릅니다. Monitoring은 숫자 메트릭(CPU, 지연시간, 에러율)을 수집하고 임계값 기반 알림을 보내고, Logging은 텍스트 로그를 수집하여 검색과 분석을 합니다. 메트릭으로 '문제가 있다'를 감지하고, 로그로 '왜 문제인지'를 파악하는 상호 보완 관계입니다.

왜 이런 방식이 등장했나요?

예전에는 서버에 Nagios, Zabbix 같은 모니터링 에이전트를 직접 설치하고 설정해야 했습니다. 클라우드 서비스가 자체 메트릭을 바로 노출하면서, 별도 설치 없이 통합 모니터링을 하는 모델이 자연스러워졌습니다.

언제 쓰나요?

프로덕션 인프라 모니터링, 서비스 가용성 확인, 성능 이상 감지에 필수입니다. 로그 기반 디버깅이나 분산 트레이싱이 주 목적이면 Cloud Logging이나 Cloud Trace가 더 맞습니다.

인프라 모니터링애플리케이션 성능가용성 확인비용 이상 감지
Official Docs

더 깊게 보기

현재 페이지의 개념 설명을 본 뒤 공식 문서로 바로 이동합니다.

GCP