Cloud VisualizerCloud Visualizer
36개 개념
← 전체 목록
🔍

Amazon Athena

분석S3 데이터 대화형 SQL 쿼리

아키텍처 다이어그램

데이터 스캔스키마 제공쿼리 결과시각화접근 제어🪣S3 (데이터 레이크)🔗Glue 카탈로그▼ 지금 보는 개념🔍Athena📋결과 (S3)📊BI 도구🔐IAM

점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다

왜 필요한가요?

S3에 데이터는 쌓였는데 이를 확인하려고 매번 분석용 클러스터를 띄우는 것은 비효율적입니다. 파일 위에서 바로 SQL로 조회하고 싶을 때가 많습니다.

안에서 어떻게 동작하나요?

Athena는 S3 데이터를 직접 스캔해 SQL 쿼리를 실행하고 결과를 다시 S3에 저장합니다. 스키마 정보는 Glue Data Catalog를 참조하고, 필요하면 BI 도구로 결과를 이어받을 수 있습니다.

왜 이런 방식이 등장했나요?

예전에는 로그나 데이터 레이크를 보기 위해 작은 조회에도 분석용 서버를 준비해야 했습니다. 이런 준비 비용을 줄이기 위해 저장된 파일을 그대로 쿼리하는 Athena 같은 서버리스 분석 모델이 등장했습니다.

언제 쓰나요?

로그 탐색, 데이터 레이크의 임시 분석, 조사성 SQL, 배치 보고서 초기 검증에 적합합니다. 반복적이고 무거운 집계를 빠르게 처리해야 하는 경우에는 맞지 않습니다.

로그 분석데이터 레이크 쿼리비용 분석Ad-hoc 분석
Official Docs

더 깊게 보기

현재 페이지의 개념 설명을 본 뒤 공식 문서로 바로 이동합니다.

AWS