📈

Google Cloud Monitoring

관리메트릭 감시와 알림

Google Cloud Monitoring은 GCP 리소스와 애플리케이션의 상태를 메트릭으로 관찰하는 서비스입니다. 운영 중인 시스템의 이상 징후를 먼저 잡아내는 관측성 계층을 맡습니다.

▶아키텍처 다이어그램

📊 데이터 흐름 다이어그램

🖥️Compute Engine

🚀Cloud Run

☸️GKE

📊Metrics

📈Dashboard

🔔Alerting Policy

✅Uptime Check

점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다

왜 필요한가요?

서비스가 느려지거나 멈췄는지 사용자가 먼저 알려주는 구조는 운영에 가장 늦습니다. 지연 시간, 오류율, 디스크 사용량 같은 신호를 미리 잡지 못하면 장애는 이미 커진 뒤입니다.

왜 이런 방식이 등장했나요?

예전에는 서버마다 모니터링 에이전트를 설치하고 대시보드를 따로 운영해야 했습니다. 클라우드 서비스가 자체 메트릭을 바로 노출하면서, 별도 설치 없이 통합 관측성을 두는 방식이 자연스러워졌습니다.

내부적으로 어떻게 동작하나요?

Cloud Monitoring은 GCP 서비스와 애플리케이션에서 메트릭을 수집하고, 대시보드에 시계열로 보여줍니다. 알림 정책에 조건을 걸면 임계값 충족 시 Notification Channel(Slack, 이메일, PagerDuty 등)로 알리고, Uptime Check은 외부에서 주기적으로 요청을 보내 가용성을 확인합니다.

경계와 구분

Cloud Monitoring과 Cloud Logging은 둘 다 관측성 도구이지만, Monitoring은 CPU, 지연시간, 에러율 같은 숫자 메트릭과 임계값 알림을 다루고 Logging은 텍스트 로그를 수집해 검색과 원인 분석을 돕습니다. 상태 이상을 먼저 감지하려면 Monitoring, 무슨 일이 있었는지 따라가려면 Logging이 맞습니다.

언제 쓰나요?

프로덕션 인프라 모니터링, 서비스 가용성 확인, 성능 이상 감지처럼 운영 신호를 먼저 잡아야 할 때 적합합니다. 사건의 본문을 오래 추적하거나 로그 중심으로 조사하는 역할은 Logging이 더 잘합니다.

인프라 모니터링애플리케이션 성능가용성 확인비용 이상 감지