
AWS Burstable 인스턴스 성능 이슈
·
클라우드 엔지니어/장애 처리
1. 모니터링으로 이슈 발견스테이징 환경의 Rabbit MQ 서버가 오후 12시 이후, CPU 사용률 100%를 반복하고 있음해당 서버는 AWS 환경에서 VM으로 구성되어 있음 2. 백엔드 팀에 이슈 전달해당 시간에 다건 MQ 발생 건 없음Rabbit MQ 브로커에도 보류된 MQ 건 없음 3. 서버에서 실시간 CPU 사용 현황 파악 Steal Time이 높은 것을 확인 (호스트 머신이 다른 VM에게 CPU를 할당하느라 현재 VM이 사용하지 못한 시간) 4. 호스트 서버를 관리하는 AWS에 문의 ● 원인 발견해당 서버의 인스턴스 유형이 Burstable 형태로 평소 기본 수준의 CPU 성능을 유지하다 성능 확장이 필요한 순간 credit을 사용하여 CPU 사용률을 높이는 형태이다. 해당 이슈가 ..