🤖

Google Vertex AI

AI/ML모델 학습과 서빙 플랫폼

Google Vertex AI는 모델 실험이 끝난 뒤 학습, 등록, 배포가 따로 흩어지지 않게 한 흐름으로 묶는 ML 운영 서비스입니다. 데이터 준비 다음 단계에서 프로덕션 예측 API까지 이어지는 경로를 하나의 플랫폼 안에서 연결할 때 중심이 됩니다.

▶아키텍처 다이어그램

🔄 프로세스 다이어그램

🪣Cloud Storage

📊BigQuery

🏋️Training

✨AutoML

📦Model Registry

🎯Endpoint

📓Workbench

점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다

왜 필요한가요?

ML 모델을 프로덕션에 올리려면 학습 인프라, 모델 저장소, 서빙 엔드포인트, 모니터링을 각각 따로 준비해야 합니다. 도구를 분리해서 조합하면 인프라 관리가 ML 자체보다 더 큰 부담이 됩니다.

왜 이런 방식이 등장했나요?

예전에는 노트북에서 실험하고, 학습용 GPU 서버를 따로 관리하고, Flask로 서빙 서버를 만들어야 했습니다. 이렇게 흩어진 과정을 하나의 플랫폼으로 묶으려는 흐름에서 Vertex AI가 나왔습니다.

내부적으로 어떻게 동작하나요?

Vertex AI는 학습(Training), 모델 저장소(Model Registry), 서빙(Endpoint)을 하나의 흐름으로 묶습니다. AutoML은 데이터를 넣으면 모델을 자동 생성하고, 커스텀 학습은 TensorFlow나 PyTorch 코드를 GPU 클러스터에서 실행합니다. 완성된 모델을 엔드포인트에 배포하면 자동 스케일링되는 REST API가 됩니다.

경계와 구분

Vertex AI와 BigQuery ML은 둘 다 모델을 학습할 수 있지만 접근 방식이 다릅니다. BigQuery ML은 SQL 안에서 간단한 모델을 다루는 데 초점이 있고, Vertex AI는 대규모 커스텀 학습, AutoML, 모델 서빙까지 전체 ML 라이프사이클을 관리합니다. SQL로 해결되는 수준이면 BigQuery ML, 본격적인 ML 파이프라인이 필요하면 Vertex AI가 맞습니다.

언제 쓰나요?

이미지 분류, 텍스트 분류, 수요 예측, 추천, 이상 탐지처럼 데이터를 직접 학습시켜 서비스 맞춤형 모델을 운영할 때 적합합니다. 이미 준비된 모델 호출만으로 끝나거나 학습 파이프라인이 필요 없는 경우에는 과할 수 있습니다.

이미지 분류수요 예측텍스트 분석생성형 AI