Mô Tả Công Việc
Là Kỹ sư Vận hành, bạn sẽ đóng vai trò quan trọng trong việc thiết kế, triển khai và duy trì các giải pháp hạ tầng có khả năng mở rộng và bảo mật. Vị trí này đòi hỏi chuyên môn thực hành về các nền tảng điện toán đám mây như Amazon AWS và Alibaba Cloud để đảm bảo hiệu suất và độ tin cậy tối ưu của hệ thống. Bạn sẽ chịu trách nhiệm quản lý các tài nguyên đám mây phức tạp như VPC, CDN, S3, ECS, EKS, ELB, MySQL, Redis và ElastiSearch, đồng thời phối hợp với các nhóm chức năng chéo để liên kết chiến lược kỹ thuật với mục tiêu kinh doanh. Vai trò bao gồm cải tiến liên tục các quy trình vận hành, tự động hóa các tác vụ lặp lại và giám sát chủ động tình trạng hệ thống để ngăn ngừa thời gian ngừng hoạt động và đảm bảo trải nghiệm người dùng liền mạch.
Trách Nhiệm Chính
- Dẫn dắt việc tạo lập và quản lý tài nguyên hạ tầng đám mây trên Amazon AWS và Alibaba Cloud, bao gồm thiết kế và cấu hình mạng VPC, tối ưu hiệu suất CDN, quản lý giải pháp lưu trữ đối tượng như S3. Triển khai các framework điều phối container (ECS, EKS) và đảm bảo phân bổ tài nguyên hiệu quả cho các ứng dụng có khả năng mở rộng.
- Phối hợp với các nhóm phát triển để tối ưu quy trình xây dựng mã, đảm bảo pipeline CI/CD hiệu quả và tích hợp liền mạch với các công cụ điều phối container. Phát triển và duy trì khả năng tự động hóa vận hành container bằng Docker, Kubernetes và các nền tảng điều phối để giảm thiểu can thiệp thủ công và nâng cao hiệu quả triển khai.
- Thiết kế và triển khai các giải pháp cao cấp cho hệ thống quan trọng, đảm bảo khả năng chịu lỗi và thời gian ngừng hoạt động tối thiểu. Thiết lập cơ chế giám sát bảo mật toàn diện bằng các công cụ như AWS CloudTrail, Alibaba Cloud Security Center và nền tảng SIEM. Xây dựng và thực thi cơ chế phục hồi sự cố, bao gồm kế hoạch khôi phục thảm họa và các cuộc diễn tập ứng phó sự cố định kỳ để kiểm tra khả năng phục hồi của hệ thống.
- Giám sát hiệu suất hệ thống và các chỉ số bảo mật theo thời gian thực bằng các công cụ như Prometheus, Grafana và ELK stack. Phân tích nhật ký và cảnh báo để xác định các vấn đề tiềm ẩn và triển khai biện pháp chủ động để giảm thiểu rủi ro. Duy trì tài liệu về cấu hình hạ tầng, giao thức bảo mật và quy trình vận hành để đảm bảo chia sẻ kiến thức và tuân thủ các tiêu chuẩn ngành.
- Hỗ trợ quản lý sự cố và nỗ lực khắc phục bằng cách phối hợp với các đội trực ca và giải quyết các vấn đề nghiêm trọng trong thời gian ngừng hoạt động sản xuất. Thực hiện phân tích nguyên nhân gốc rễ để xác định lỗ hổng hệ thống và triển khai giải pháp dài hạn để ngăn ngừa tái diễn. Cập nhật liên tục các công nghệ đám mây mới nổi và phương pháp tốt nhất ngành để không ngừng nâng cao năng lực vận hành.
Yêu Cầu Công Việc
- Kinh nghiệm chứng minh (3+ năm) trong vận hành đám mây, với chuyên môn về Amazon AWS và Alibaba Cloud. Khả năng thiết kế và quản lý kiến trúc đám mây phức tạp, bao gồm mạng, lưu trữ và giải pháp cơ sở dữ liệu.
- Thành thạo công nghệ container hóa (Docker, Kubernetes) và phát triển pipeline CI/CD. Kinh nghiệm với các công cụ tự động hóa như Terraform, Ansible và Jenkins để tối ưu quy trình cung cấp hạ tầng và triển khai.
- Hiểu biết sâu sắc về tính sẵn sàng cao, khôi phục thảm họa và phương pháp bảo mật tốt nhất. Quen thuộc với các công cụ như AWS Auto Scaling, Alibaba Cloud Load Balancer và nền tảng giám sát bảo mật (SIEM) để đảm bảo độ tin cậy hệ thống và bảo vệ dữ liệu.
- Kỹ năng giải quyết vấn đề xuất sắc với khả năng khắc phục sự cố hệ thống phức tạp. Tư duy phân tích mạnh mẽ để xác định điểm nghẽn hiệu suất và triển khai giải pháp dựa trên dữ liệu để tối ưu hóa hệ thống.
- Khả năng làm việc trong môi trường nhịp độ nhanh với sự giám sát tối thiểu. Kỹ năng giao tiếp tốt để hợp tác với nhà phát triển, đội bảo mật và các bên liên quan đồng thời ghi chép quy trình kỹ thuật và trình bày giải pháp.
- Ưu tiên ứng viên có chứng chỉ điện toán đám mây (AWS Certified Solutions Architect, Alibaba Cloud ACA) và điều phối container (CKA, AWS Certified Kubernetes). Quen thuộc với thực hành DevOps và phương pháp hạ tầng dưới dạng mã (IaC) là lợi thế lớn.
