직무 설명
본 직무는 엔터프라이즈 수준의 IT 인프라를 관리 및 유지보수하여 시스템 가용성과 최적의 성능을 지속적으로 보장할 수 있는 고도의 기술을 보유한 전문가를 요구합니다. 이상적인 후보자는 Kubernetes 기반 환경에 중점을 두고 확장 가능한 클라우드 네이티브 솔루션을 설계, 배포 및 운영할 책임이 있습니다. 시스템 상태 모니터링, 잠재적 문제 사전 식별 및 해결, 가동 중지 시간 최소화를 위한 강력한 인시던트 대응 프로토콜 구현에서 핵심적인 역할을 수행하게 됩니다. 또한 인프라 전략을 비즈니스 목표 및 기술 요구사항과 조율하기 위해 크로스 기능 팀과 협력하는 업무도 포함됩니다.
주요 책임
- 서버, 네트워크 및 스토리지 시스템에 대한 사전 예방적 모니터링, 유지보수 및 문제 해결을 통해 중요 인프라의 24/7 가용성 보장
- 병목 현상 분석, 구성 최적화 및 리소스 관리를 위한 자동화 도구 구현을 통해 시스템 성능 및 확장성 최적화
- 인시던트에 신속히 대응, 근본 원인 분석 수행 및 재발 방지를 위한 솔루션 문서화하면서 SLA 준수 유지
- 컨테이너 오케스트레이션, 노드 프로비저닝 및 CI/CD 파이프라인 통합을 포함한 Kubernetes 클러스터 배포 및 관리
- 인프라 자산 보호 및 데이터 무결성 보장을 위한 보안 모범 사례 및 규정 준수 표준 구현
- 개발자 및 DevOps 팀과 협력하여 확장 가능한 아키텍처 설계 및 애플리케이션 수준 문제 해결
- 시스템 메트릭 및 로그 모니터링을 통해 성능 트렌드 식별, 리소스 할당 최적화 및 전반적인 시스템 안정성 향상
- 인프라 개선 및 혁신을 권장하기 위해 신기술 및 업계 동향 지속적 파악
- 기술 프로세스, 구성 및 인시던트 해결 방법 문서화를 통해 지식 공유 및 운영 연속성 보장
- 향후 요구 사항 예측 및 인프라 준비 상태 확인을 위한 정기적인 시스템 감사 및 용량 계획 수행
자격 요건
- 시스템 관리, DevOps 또는 관련 분야에서 최소 5년 이상의 인프라 관리 경력 보유
- Docker 및 Helm과 같은 컨테이너 오케스트레이션 도구에 대한 이해를 포함한 Kubernetes 클러스터 배포, 구성 및 운영 전문성
- 인프라 확장성을 위한 클라우드 플랫폼(AWS, Azure, GCP) 및 하이브리드 클라우드 환경에 대한 심층 이해
- 시스템 유지보수 작업을 위한 스크립팅 언어(Python, Bash, PowerShell) 및 자동화 프레임워크 숙련도
- 인프라 복원력 보장을 위한 네트워크 프로토콜, DNS 관리 및 보안 관행(방화벽, 암호화, IAM) 지식
- 시스템 성능 메트릭 분석 및 지연 시간 감소 및 리소스 최적화를 위한 솔루션 구현 능력
- 실시간 시스템 상태 추적 및 인시던트 감지를 위한 모니터링 도구(Prometheus, Grafana, ELK 스택) 경험
- 복잡한 기술 문제 진단 및 예방 조치 개발을 위한 우수한 문제 해결 능력 및 분석적 사고
- 이해 관계자와 협력, 기술 프로세스 문서화 및 솔루션 효과적 제시를 위한 강력한 커뮤니케이션 능력
- Certified Kubernetes Administrator(CKA), AWS Certified Solutions Architect 또는 CompTIA Security+와 같은 선호 자격증
- 빠른 속도의 환경에서 세부 사항 및 조직 능력에 대한 강한 집중력을 갖춘 업무 수행 능력
- 자동화된 배포 및 구성 관리를 위한 CI/CD 파이프라인 및 Infrastructure-as-Code(IaC) 관행 경험
- 인프라 복원력을 위한 재해 복구 전략 및 비즈니스 연속성 계획 이해
- 확장 가능한 클라우드 솔루션을 위한 컨테이너화 기술 및 마이크로서비스 아키텍처 지식
- 엔터프라이즈 요구 사항을 충족하는 안전하고 고성능의 인프라 솔루션 설계 및 구현 능력