职位描述
我们正在寻找一位技术娴熟的专业人士,负责设计、实施并管理全面的监控解决方案,以确保我们基础设施和应用的高可用性与性能表现。理想的候选人将与跨职能团队协作,将监控工具集成至CI/CD流程中,并主导事件响应工作。
核心职责
- 设计、实施并管理全面的监控解决方案,确保基础设施和应用的高可用性与性能表现
 - 开发维护健全的记录与告警机制,主动识别并消除潜在问题
 - 与基础设施团队协作,将监控方案集成至CI/CD流程,保障无缝部署与运行
 - 执行性能分析、容量规划及扩展性测试,确保系统满足当前与未来需求
 - 主导事件响应与故障排查工作,利用监控数据快速解决运营问题
 
任职要求
- 具备为复杂基础设施和应用设计实施监控解决方案的实战经验
 - 深入理解CI/CD流程,并有监控工具集成经验
 - 出色的问题解决能力及性能指标分析能力
 - 具有基于监控数据开展事件响应和故障排查的经验
 - 能够高效协同基础设施与开发团队开展工作
 - 掌握容量规划及扩展性测试方法论
 


