반응형
지난 10월 16일 AWS 센터필드에서 열린 CSE Technical Workshop에 다녀왔었다.
EKS와 RDS에 대해 헷갈렸던 문제를 콕콕 찝어줘서 정말 유익했던 시간이었다.
자주 묻는 질문 보니 나도 종종 케이스 오픈으로 올렸던 내용이었다.
똑같은 질문을 여러번 받으셨을 AWS 담당자 분들 얼마나 힘드셨을까
4개의 세션에서 들었던 내용 중 특히나 도움이 되었던 내용을 정리해보려 한다.
[Aurora] Aurora MySQL 업그레이드 & 트러블 슈팅
- Auto Minor Version Upgrade 활성화시 자동으로 업그레이드 진행되고, 활성화 꺼도 업그레이드 되는 점 주의하자
- 계획되지 않은 일정 및 주기에 업그레이드가 진행될 수 있나?
- 수행될 수 있다. Auto Minor Version Upgrade - Yes 경우 DB 자동으로 업그레이드 일정 예약된다
- 마이너 업그레이드의 경우 EOL 이전에 업데이트하지 않으면 이후에 강제 업그레이드 되니 미리 할 것!
- 블루/그린 배포시 블루 환경 이름에는 tmp 를 포함할 수 없음!
- 메이저/마이너 업그레이드 늦추는 요소
- 높은 HLL
- Purge 작업
- RDS 지연 로딩
[EKS] EKS에서 자주 발생하는 문제 NotReady 원인과 트러블슈팅
- EC2 상태체크
- 시스템 상태 체크
- 호스트서버 장애이기 때문이고 재부팅해야 함
- AWS 문제
- 인스턴스 상태 체크
- OS 레벨 문제이고 AWS 책임 아님. 원인 찾아내야 함
- 시스템 상태 체크
[RDS] 클라우드 스케일의 애플리케이션을 위한 RDS Architecture & Tip
- Multi AZ
- 장애 발생시 빠른 복구를 위한 동기식 솔루션임
- 읽기 부하 분산 솔루션 아니고 빠른 장애 복구용임 주의
- 옵션그룹
- Oracle 타임존 기능
- 절 대 바 꿀 수 없 다
- 백업하고 복구할 때에도 반드시 같은 옵션 그룹 넣어줘야 함
- Oracle 타임존 기능
- RDS Failover 이후 접속 안 됨
- 라우팅 테이블 확인
- 멀티 AZ 경우 스탠바이 서버가 Active 되고 이 때문에 서브넷이 바뀌고 잘못된 서브넷 설정으로 접속 안 될 수도
- 어플리케이션에서 너무 높은 DNS TTL 설정값으로 인해서 바뀐 IP 인식 못함 → 어플리케이션 재기동 후 해결될 수도
- 처음 RDS 인스턴스 만들 때 400G 이상 추천
- 400G 이상일 때 4개 스토리지 볼륨이 증설 되기 때문
ALB Troubleshooting
- 503 에러 발생 시
- 등록되어있는 타겟이 있는지 확인
- 460 에러의 발생 시
- 클라이언트의 제한 시간 > 로드밸런서의 유휴 제한 시간 인지 확인
중간에 업무전화 때문에 놓친 부분도 있었지만 같이 갔던 동료의 도움으로 빠짐없이 발표를 들을 수 있었다.
반응형
'OPS' 카테고리의 다른 글
[Route53] 다중 Account 환경에서 Route53 private hosted-zone 사용하는 경우 (0) | 2023.10.26 |
---|---|
[RI] AWS RI 구매 (주의사항, 진행 순서) (0) | 2023.10.23 |
Xshell에서 여러 세션에 동일한 명령어 보내기 (1) | 2023.10.05 |
.NET Framework 4.0 → 4.8 업그레이드 (0) | 2023.08.30 |
SSM 매니저로 AWS 서버 바로 접속하기 (0) | 2023.08.27 |