← 전체 목록
🔍
Amazon Athena
분석S3 데이터 대화형 SQL 쿼리
▶아키텍처 다이어그램
점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다
왜 필요한가요?
S3에 데이터는 쌓였는데 이를 확인하려고 매번 분석용 클러스터를 띄우는 것은 비효율적입니다. 파일 위에서 바로 SQL로 조회하고 싶을 때가 많습니다.
안에서 어떻게 동작하나요?
Athena는 S3 데이터를 직접 스캔해 SQL 쿼리를 실행하고 결과를 다시 S3에 저장합니다. 스키마 정보는 Glue Data Catalog를 참조하고, 필요하면 BI 도구로 결과를 이어받을 수 있습니다.
무엇과 헷갈리나요?
Athena와 Redshift는 둘 다 SQL 분석이 가능하지만 사용 방식이 다릅니다. Athena는 서버리스로 파일을 바로 읽는 질의 엔진이고, Redshift는 데이터를 적재해 두고 반복 분석하는 웨어하우스입니다.
왜 이런 방식이 등장했나요?
예전에는 로그나 데이터 레이크를 보기 위해 작은 조회에도 분석용 서버를 준비해야 했습니다. 이런 준비 비용을 줄이기 위해 저장된 파일을 그대로 쿼리하는 Athena 같은 서버리스 분석 모델이 등장했습니다.
언제 쓰나요?
로그 탐색, 데이터 레이크의 임시 분석, 조사성 SQL, 배치 보고서 초기 검증에 적합합니다. 반복적이고 무거운 집계를 빠르게 처리해야 하는 경우에는 맞지 않습니다.
로그 분석데이터 레이크 쿼리비용 분석Ad-hoc 분석
Official Docs
AWS더 깊게 보기
현재 페이지의 개념 설명을 본 뒤 공식 문서로 바로 이동합니다.