직무 설명:
운영 팀의 핵심 구성원으로서, 귀하는 핵심 비즈니스 시스템과 클라우드 플랫폼의 안정성, 확장성 및 효율성을 보장할 책임이 있습니다. 귀하의 전문성은 고가용성 인프라 유지 및 운영 프로세스 최적화에 직접적으로 기여할 것입니다.
- 핵심 비즈니스 시스템, 클라우드 플랫폼(AWS/알리윈/텐센트 클라우드) 및 기반 서비스(Kubernetes, Docker, Nginx, MySQL, Redis, Kafka)의 배포, 최적화 및 고가용성 보장.
- 시스템 용량 관리, 성능 최적화 및 재해 복구 솔루션 계획 및 구현을 통해 서비스 안정성과 확장성 보장.
- CI/CD 파이프라인 구축 및 유지 관리로 자동화된 빌드, 테스트, 배포 및 롤백 달성.
- 시스템 모니터링, 로그 수집 및 경고 시스템(Prometheus/Grafana/ELK/OpenSearch) 설계 및 개선.
- 프로덕션 사고에 대한 긴급 대응, 문제 해결 및 사후 분석에 참여하여 장기적인 최적화 추진.
- 운영의 표준화 및 프로세스 개선에 기여하고 모범 사례 문서화.
- 전체 운영 비용 평가 및 IT 지출 감사.
자격 요건:
대규모 인터넷 또는 클라우드 플랫폼 운영 경험이 풍부한 고도로 숙련된 전문가를 찾고 있습니다. 이상적인 후보자는 강력한 기술 전문성과 문제 해결 능력을 갖추고 있을 것입니다.
- 컴퓨터 과학 또는 관련 분야의 학사 학위 이상, 대규모 인터넷 또는 클라우드 플랫폼 운영 경력 5년 이상.
- Linux 시스템 및 최소 하나의 스크립팅/프로그래밍 언어(Shell/Python/Go)에 능숙.
- Docker, Kubernetes 및 CI/CD 도구 체인(Jenkins, GitLab CI, ArgoCD 등)에 대한 전문 지식.
- 모니터링 및 로깅 시스템(Prometheus, Grafana, ELK/OpenSearch)에 익숙.
- 퍼블릭 클라우드 아키텍처(AWS, Aliyun, GCP, Azure) 경험.
- 강력한 커뮤니케이션 기술 및 팀워크 정신, 복잡한 문제를 신속하게 식별하고 해결할 수 있는 능력.
우대 사항:
- IT 운영 비용 최적화에 대한 광범위한 경험.
- 기업 클라우드 환경에서의 글로벌 네트워크 가속화 및 보안 배포 경험.
- 탁월한 문서 작성 능력.
혜택:
완전한 원격 근무 환경, 경쟁력 있는 급여 및 성과 보너스, 협업과 전문적 성장을 촉진하는 긍정적인 팀 분위기를 제공합니다.


