Auto Scaling Group은 부하에 따라 VM 인스턴스 수를 자동 조정해 성능을 유지하고, 불필요한 자원 낭비를 줄이는 기능입니다.
자동 확장(Auto Scaling)
트래픽 증가 시 자동으로 서버 추가, 사용량 줄면 자동 축소
개요 (Overview)
주요 구성 요소 (Core Components)
| 구성 항목 | 설명 | 주요 역할 / 예시 |
|---|---|---|
| Launch Configuration (시작 구성) |
Auto Scaling 시 사용할 인스턴스 템플릿을 정의합니다. 이미지, 인스턴스 타입(Flavor), 네트워크, 보안 그룹, SSH 키 등의 설정이 포함됩니다. |
주요 역할: 동일한 사양의 인스턴스를 일관되게 생성하기 위한 기준 템플릿. 예시: 웹 서버용 템플릿을 기반으로 트래픽 증가 시 동일 설정의 VM 자동 생성 |
| Scaling Policy (스케일링 정책) |
CPU, 네트워크 사용률 등의 모니터링 지표를 기준으로 확장(Scale Out) 또는 축소(Scale In) 조건을 정의합니다. | 주요 역할: 트래픽 부하나 CPU 점유율에 따라 인스턴스 수를 자동으로 조정. 예시: CPU 70% 이상 시 1대 추가, 30% 이하 시 1대 축소 |
| Capacity Settings (용량 설정) |
최소(Min), 최대(Max), 원하는 유지 수(Desired) 인스턴스 수를 지정합니다. 시스템은 설정된 정책에 따라 이 범위 내에서 인스턴스 수를 자동으로 조정합니다. |
주요 역할: 서비스 안정성과 비용을 균형 있게 관리. 예시: Min 2, Max 8, Desired 3으로 설정해 부하에 따라 2~8대 사이로 조정 |
| Health Check (상태 확인) |
Auto Scaling Group 내 인스턴스의 상태를 주기적으로 점검하여 비정상 인스턴스를 자동 교체하거나 복구합니다. 이를 통해 항상 정상 상태의 인스턴스 수를 유지합니다. | 주요 역할: 장애 시에도 정상 인스턴스 수를 지속적으로 유지. 예시: 네트워크 응답 없음 또는 프로세스 오류 시 자동 재배치 |
| Monitoring Metrics (모니터링 지표) |
Auto Scaling의 정책 판단 기준이 되는 실시간 성능 데이터입니다. CPU 사용률, 네트워크 트래픽 등 주요 지표를 기반으로 자동 확장·축소가 수행됩니다. |
주요 역할: 정책 실행의 판단 기준 제공. 예시: CPU 70% 도달 시 스케일 아웃 트리거 발생 |
동작 방식 (Operation Flow)
사용자가 Auto Scaling Group과 정책을 설정하면, 모니터링 지표에 따라 VM이 자동으로 생성·제거되어 부하에 대응하고 비용을 절감합니다.
주요 장점 (Benefits)
- 비용 효율성: 부하가 낮을 때 자동으로 인스턴스를 축소하여 비용 절감
- 가용성 향상: 트래픽 급증 시 자동 확장을 통해 서비스 중단 방지
- 운영 자동화: 관리자가 수동으로 조정할 필요 없음
- 정책 기반 제어: 원하는 조건, 스케줄, 성능 기준에 따라 유연하게 제어 가능