Mô tả Công việc
Trách nhiệm Chính
- Triển khai các bản cập nhật và sửa lỗi để đảm bảo tính ổn định và hiệu suất của dịch vụ, bao gồm kiểm soát phiên bản, kiểm thử và quy trình hoàn tác.
- Giám sát tình trạng hệ thống và duy trì thời gian hoạt động cao bằng cách chủ động xác định và giảm thiểu các rủi ro tiềm ẩn.
- Cung cấp hỗ trợ kỹ thuật Cấp 2 để giải quyết các vấn đề được chuyển tiếp, đồng thời sẵn sàng ứng phó với các nhu cầu khẩn cấp của nhóm DevOps trong thời gian ngừng sản xuất.
- Phát triển và duy trì các công cụ tự động phát hiện lỗi, giảm thiểu can thiệp thủ công và cải thiện hiệu quả hoạt động tổng thể.
- Thiết kế và triển khai các giải pháp tích hợp cho các hệ thống back-end nội bộ, đảm bảo khả năng tương thích và nhất quán dữ liệu trên các nền tảng.
- Tiến hành phân tích nguyên nhân gốc rễ cho các lỗi sản xuất, ghi chép kết quả và đề xuất các biện pháp phòng ngừa để tránh tái diễn.
- Điều tra và giải quyết các vấn đề kỹ thuật phức tạp, bao gồm cấu hình hệ thống, kết nối mạng và các điểm nghẽn hiệu suất ứng dụng.
- Tạo và cải tiến các kịch bản để tự động hóa các nhiệm vụ trực quan hóa, chẳng hạn như xử lý dữ liệu, báo cáo và tạo bảng điều khiển.
- Thiết lập các quy trình tiêu chuẩn cho việc khắc phục sự cố hệ thống, bảo trì và ứng phó sự cố để đảm bảo tính nhất quán và khả năng mở rộng.
- Hợp tác với các nhóm chức năng chéo để điều chỉnh các giải pháp kỹ thuật phù hợp với mục tiêu kinh doanh và yêu cầu người dùng.
- Liên tục tối ưu hóa quy trình làm việc hệ thống và cơ sở hạ tầng để nâng cao độ tin cậy, bảo mật và trải nghiệm người dùng.
- Cập nhật các công nghệ mới và phương pháp tốt nhất trong ngành để thúc đẩy đổi mới trong quản lý hệ thống và tự động hóa.
Yêu cầu Công việc
- Có kinh nghiệm chứng minh trong hoạt động DevOps, với thành tích duy trì thời gian hoạt động hệ thống cao và giải quyết các sự cố quan trọng.
- Kiến thức chuyên sâu về quản trị hệ thống, công cụ tự động hóa (ví dụ: Ansible, Puppet) và nền tảng đám mây (ví dụ: AWS, Azure).
- Kỹ năng giải quyết vấn đề xuất sắc và khả năng phân tích các tình huống kỹ thuật phức tạp để xác định nguyên nhân gốc rễ và triển khai các giải pháp hiệu quả.
- Thành thạo các ngôn ngữ kịch bản (ví dụ: Python, Bash) cho các nhiệm vụ tự động hóa và trực quan hóa, bao gồm tích hợp API và xử lý dữ liệu.
- Hiểu biết sâu sắc về vòng đời phát triển phần mềm, với kinh nghiệm tích hợp ứng dụng với các hệ thống back-end nội bộ.
- Khả năng thiết kế và ghi chép các quy trình tiêu chuẩn cho bảo trì hệ thống, khắc phục sự cố và quản lý sự cố.
- Kỹ năng giao tiếp tốt để hợp tác với các nhóm và giải thích các giải pháp kỹ thuật cho các bên liên quan không chuyên.
- Ưu tiên: Kinh nghiệm với các đường ống CI/CD, công nghệ container hóa (ví dụ: Docker, Kubernetes) và công cụ giám sát (ví dụ: Prometheus, Grafana).
- Khả năng làm việc độc lập và theo nhóm, với cách tiếp cận chủ động để xác định các cơ hội cải tiến.
- Chú ý chi tiết và cam kết cung cấp các giải pháp kỹ thuật chất lượng cao, đáng tin cậy phù hợp với mục tiêu kinh doanh.
- Ưu tiên: Quen thuộc với khung ITIL và phương pháp quản lý sự cố tốt nhất.
- Khả năng thích ứng với các công nghệ phát triển và liên tục cải thiện hiệu suất hệ thống và giao thức bảo mật.
