Mô tả Công việc
Với vai trò là Kỹ sư DevOps Cấp cao, bạn sẽ đóng vai trò then chốt trong việc thiết kế, triển khai và duy trì cơ sở hạ tầng đám mây để hỗ trợ hoạt động mở rộng và bảo mật. Bạn sẽ phát triển và duy trì các kịch bản tự động hóa để tối ưu hóa quy trình phát triển, nâng cao độ tin cậy hệ thống và cải thiện quy trình phân phối phần mềm thông qua các phương pháp tích hợp và triển khai liên tục. Vị trí này yêu cầu bạn xây dựng và quản lý bảng điều khiển cùng các chỉ số cung cấp thông tin chi tiết có thể hành động về hiệu suất hạ tầng, tình trạng hệ thống và hiệu quả vận hành. Bạn cũng sẽ thiết lập các quy trình và tự động hóa mạnh mẽ cho giám sát, cảnh báo và ghi nhật ký trên các hệ thống phân tán, đảm bảo phát hiện và xử lý sự cố kịp thời. Ngoài ra, bạn sẽ dẫn dắt các nỗ lực tối ưu hóa mã hạ tầng thông qua đánh giá định kỳ, xác định cơ hội cải tiến và áp dụng các phương pháp tốt nhất. Trách nhiệm của bạn bao gồm cập nhật các công cụ mới, dịch vụ đám mây và xu hướng ngành để thúc đẩy đổi mới và duy trì lợi thế cạnh tranh trong hoạt động.
Trách Nhiệm Chính
- Thiết kế, triển khai và duy trì các giải pháp hạ tầng đám mây sử dụng AWS, Azure hoặc GCP để đảm bảo khả năng mở rộng, độ tin cậy và bảo mật.
- Phát triển và duy trì các kịch bản tự động hóa cho đường ống CI/CD, cung cấp hạ tầng và điều phối hệ thống bằng các công cụ như Ansible, Terraform hoặc Jenkins.
- Xây dựng và quản lý bảng điều khiển tập trung cùng các chỉ số sử dụng nền tảng như Grafana, Prometheus hoặc Kibana để giám sát hiệu suất hệ thống và tình trạng hạ tầng.
- Thiết lập khung giám sát, cảnh báo và ghi nhật ký từ đầu đến cuối để đảm bảo khả năng hiển thị thời gian thực về hành vi hệ thống và bất thường vận hành.
- Cộng tác với các nhóm phát triển để triển khai các phương pháp DevOps tốt nhất, bao gồm đánh giá mã, quản lý cấu hình và chiến lược triển khai.
- Tiến hành kiểm toán mã hạ tầng định kỳ để xác định nợ kỹ thuật, lỗ hổng bảo mật và điểm nghẽn hiệu suất.
- Dẫn dắt phản ứng sự cố và phân tích nguyên nhân gốc rễ cho các vấn đề vận hành, đảm bảo các biện pháp chủ động ngăn ngừa tái diễn.
- Cập nhật các công cụ DevOps mới nhất, công nghệ đám mây và tiêu chuẩn ngành để liên tục cải thiện năng lực vận hành.
- Cung cấp cố vấn và đào tạo cho các kỹ sư cơ sở và nhóm phát triển về phương pháp DevOps, phương pháp tự động hóa tốt nhất và công nghệ cloud-native.
- Đảm bảo phù hợp với kiến trúc tổ chức, chính sách bảo mật thông tin và chiến lược kỹ thuật thông qua các quy trình và công cụ tiêu chuẩn hóa.
Yêu Cầu Công Việc
- Có kinh nghiệm chứng minh với vai trò Kỹ sư DevOps tối thiểu 5 năm trong thiết kế hạ tầng đám mây và tự động hóa.
- Chuyên môn về nền tảng đám mây (AWS, Azure, GCP) và công nghệ container hóa (Docker, Kubernetes) để triển khai hệ thống mở rộng.
- Thành thạo ngôn ngữ kịch bản (Python, Bash, PowerShell) và công cụ quản lý cấu hình (Ansible, Terraform, Puppet).
- Kinh nghiệm với đường ống CI/CD, bao gồm các công cụ như Jenkins, GitLab CI hoặc CircleCI để tự động hóa kiểm thử, triển khai và quy trình hoàn tác.
- Hiểu biết về công cụ giám sát và quan sát (Prometheus, Grafana, ELK Stack) để theo dõi hệ thống thời gian thực và phân tích.
- Khả năng thiết kế và triển khai giải pháp hạ tầng bảo mật tuân thủ tiêu chuẩn ngành (GDPR, ISO 27001) và chính sách nội bộ.
- Kỹ năng giải quyết vấn đề xuất sắc với thành tích giải quyết các vấn đề vận hành phức tạp và tối ưu hiệu suất hệ thống.
- Khả năng giao tiếp và cộng tác mạnh mẽ để làm việc với các nhóm chức năng chéo, bao gồm nhà phát triển, bảo mật và vận hành.
- Chứng chỉ ưu tiên như AWS Certified DevOps Engineer, Azure DevOps Engineer hoặc Google Cloud Professional DevOps Engineer.
- Kinh nghiệm với phương pháp infrastructure-as-code (IaC) và hệ thống kiểm soát phiên bản (Git) để quản lý tài nguyên và cấu hình đám mây.
- Khả năng dẫn dắt và cố vấn kỹ sư cơ sở, thúc đẩy văn hóa cải tiến liên tục và phương pháp tốt nhất trong quy trình DevOps.
- Thành thạo khung bảo mật đám mây (IAM, VPC, mã hóa) để đảm bảo bảo vệ dữ liệu và tuân thủ quy định.
- Kinh nghiệm với quy trình kiểm thử tự động và đảm bảo chất lượng để xác thực thay đổi hạ tầng và cập nhật hệ thống.
- Hiểu biết sâu về kiến trúc hệ thống, nguyên tắc mở rộng và mẫu thiết kế sẵn sàng cao.
- Khả năng tài liệu hóa quy trình, công cụ và cấu hình hạ tầng để chia sẻ kiến thức và đào tạo nhóm.
- Kinh nghiệm với hệ thống quản lý sự cố (ví dụ: PagerDuty, Opsgenie) để theo dõi và giải quyết sự cố vận hành.
- Hiểu biết về chiến lược tối ưu chi phí cho hạ tầng đám mây để đảm bảo sử dụng tài nguyên hiệu quả và tuân thủ ngân sách.
- Khả năng thiết kế và triển khai kế hoạch phục hồi sau thảm họa và liên tục kinh doanh cho hệ thống và dịch vụ quan trọng.
- Kỹ năng phân tích mạnh để diễn giải chỉ số, nhật ký và dữ liệu hệ thống cho điều chỉnh hiệu suất và lập kế hoạch dung lượng.