직무 설명
회사 IT 시스템의 전반적인 운영 및 관리를 담당하여 시스템의 안정적이고 효율적인 운영을 보장합니다. 주요 책임에는 서버, 네트워크 장비 등 하드웨어 시설의 실시간 상태 모니터링, 로그 분석 및 성능 지표 추적 등을 통한 시스템 건강도 관리가 포함됩니다. 다양한 IT 장애에 신속하게 대응하고 전문 도구를 활용하여 근본 원인 분석 및 해결 방안을 수립해야 합니다. 또한 시스템 보안 방어 체계 구축 및 유지를 담당하며, 정기적으로 안티바이러스 소프트웨어, 방화벽 규칙 및 침입 탐지 시스템을 업데이트하고 보안 패치 관리를 실행합니다. 벤치마크 테스트, 부하 분석 등의 방법으로 시스템 성능을 지속적으로 최적화하고 용량 계획 방안을 수립 및 실행합니다. 완벽한 운영 문서 체계를 구축하여 시스템 구성 변경, 장애 처리 절차 및 보안 이벤트 로그를 기록하며, 팀에 지식 공유 지원을 제공합니다.
주요 책임
- 24/7 IT 시스템 모니터링을 실시하여 Zabbix/Nagios 등의 도구로 서버, 네트워크 장비, 스토리지 시스템 등 하드웨어 자원의 운영 상태를 추적하며, 시스템 가용성을 99.9% 이상으로 유지
- 장애 관리 시스템을 구축하여 이벤트 분류, 우선순위 평가, SLA 모니터링 등의 프로세스로 문제의 폐쇄적 처리를 구현하며, 평균 장애 복구 시간을 30분 이내로 통제
- 네트워크 보안 전략을 수립하고 방화벽 규칙, IDS/IPS 장비를 배치하며, 정기적으로 취약점 스캔 및 침투 테스트를 실행하여 ISO 27001 등의 보안 표준 준수 보장
- 시스템 성능 튜닝 작업을 수행하여 벤치마크 테스트, 자원 활용률 분석, 데이터베이스 최적화 등의 방법으로 시스템 응답 속도 및 처리량 향상
- 완벽한 IT 운영 지식 베이스를 유지하며, 시스템 아키텍처 문서, 운영 매뉴얼 및 장애 사례 분석 보고서를 작성하여 기술 전수 및 프로세스 표준화 보장
- 개발 팀과 협력하여 DevOps 프로세스를 구현하고 시스템 배포, 구성 관리 및 버전 관리를 참여하며 변경 과정의 추적성 보장
- IT 자산 관리 계획을 수립 및 실행하고 하드웨어 장비의 라이프사이클을 추적하며 구매 및 폐기 프로세스 최적화
- 자동화 운영 방안을 설계하고 스크립트 도구를 개발하여 구성 백업, 로그 분석, 건강 검사 등의 반복 작업 자동화 구현
- 사용자 지원 체계를 구축하고 최종 사용자의 기술 문의를 처리하며 셀프 서비스 포털 및 지식 베이스의 최적화 방안 수립
- 정기적으로 시스템 감사를 수행하여 GDPR 등의 데이터 보호 규정 준수를 보장하며, 준수 문서 및 감사 보고서 유지
자격 요건
- 컴퓨터 과학 또는 관련 전공 학사 학위 이상, CISSP, CISP, PMP 등의 전문 자격증 보유자 우대
- 3년 이상 IT 운영 경험, 대규모 분산 시스템 관리 경험 보유, Linux/Windows 서버 아키텍처에 익숙
- 네트워크 프로토콜(TCP/IP, BGP, OSPF 등)에 능숙, 네트워크 장비 구성 관리(Cisco, H3C 등 브랜드)에 익숙
- 주요 보안 도구(방화벽, IDS/IPS, SIEM 시스템)의 배치 및 튜닝에 능숙, 보안 이벤트 긴급 대응 능력 보유
- 데이터베이스 관리 시스템(MySQL, Oracle, SQL Server 등)에 익숙, 데이터베이스 성능 튜닝 및 백업 복구 가능
- 스크립트 개발 능력(Python, Shell, PowerShell 등) 보유, 자동화 운영 도구 및 모니터링 스크립트 작성 가능
- ITIL 서비스 관리 프레임워크에 익숙, 서비스 수준 계약(SLA) 관리 및 변경 관리 프로세스 실행 경험 보유
- 훌륭한 커뮤니케이션 및 조정 능력 보유, 부서 간 팀과 협력하여 IT 프로젝트 추진 가능
- 영어 독해 및 작성 능력 보유, 영어 기술 문서 읽기 및 국제 기술 교류 참여 가능
- CompTIA Security+, CEH 등의 보안 자격증 보유, 등급 2.0 관련 요구 사항에 익숙
- 클라우드 플랫폼 관리 경험(AWS, Azure, 알리바바 클라우드 등) 보유, 컨테이너 기술(Docker, Kubernetes)에 익숙
- IT 서비스 관리 도구(ServiceNow, Jira, ZenTao 등)에 익숙, 티켓 관리 및 서비스 프로세스 최적화 가능
- 데이터 백업 및 재해 복구 방안 설계 능력 보유, RAID, SAN/NAS 등의 스토리지 기술에 익숙
- 시스템 모니터링 도구(Prometheus, Zabbix, SolarWinds 등)에 익숙, 지표 수집 및 시각적 분석 가능
- 훌륭한 문제 해결 능력 보유, 복잡한 시스템 장애를 독립적으로 분석하고 해결 방안 수립 가능