About Me
Experience
产品总监
听云 - - Now
职位: 产品总监 | 时间段: 2020.01-2025.02 | 工作内容: 先后负责基础设施听云Infra产品和可观测性观云产品的从零到一建设及商业化落地。1. 听云Infra:涵盖主机监控、进程监控、组件中间件监控、数据库、Docker、K8s监控等,利用USE方法和RED方法对系统监控指标进行梳理、归类与调优。2. 观云智能可观测平台:以数据湖仓作为可观测性数据底座,构建低成本高性能的统一数据存储框架,实现存算分离和高可用;基于可观测性数据模型优化底层存储,并支持持续整合OpenTelemetry标准数据。成果描述:1. 推动主机、进程、容器、APM监控纵向打通,提升故障根因定位能力。2. 设计并优化指标、日志、链路三大数据域的集成方案,推动ETL数据转换流程,确保多源数据无缝接入数据湖仓,并结合NBQL提供统一查询接口。3. 设计并推动AI大模型与可观测性结合方案,通过自然语言转NBQL降低使用门槛。重点项目:某大型国有银行可观测性平台建设项目描述:传统监控工具无法满足云原生环境下的观测需求,基于OpenTelemetry标准重构数据采集层,设计统一观测数据湖,整合20+异构系统监控数据。项目成果:关键业务系统黄金指标可视化率达100%,重大故障处理时效提升50%。
运维总监
听云 - - Now
职位: 运维总监 | 时间段: 2012.04-2020.01 | 工作内容: 负责公司线上运维和私有化运维团队管理、运维架构设计,以及容器化、上云等工作。成果描述:1. 带领团队完成线上环境从传统IDC到云环境迁移,并完成从UCloud到腾讯云的迁移。2. 推动原有架构向Docker化架构演进,完成线上系统整体Docker化并迁移至Kubernetes环境。3. 从运维视角参与APM产品和技术架构设计。4. 完成整体迁移成本节约42%,年运维费用减少360万元,系统稳定性达99.95%,故障响应时间缩短60%。重点项目:混合云架构改造项目技术栈:AWS、阿里云、腾讯云、UCloud、VMware ESXi、Kubernetes、跨机房VPN网络专线、Oracle RAC、MySQL主从同步、Druid、CK。职责描述:1. 负责迁移规划与架构设计。2. 完成IDC环境评估,制定“非核心业务→混合云→全云原生”三阶段迁移路线,规划200+虚拟机、80TB业务数据迁移。3. 设计混合云网络架构,通过VPN专线连接不同云,网络延迟降低至5ms以内,解决Oracle RAC和MySQL主从同步问题,并利用Kubernetes模板完成应用快速迁移。4. 搭建SaltStack自动化平台,完成80%服务器配置的标准化迁移。5. 推动关键系统改造,完成去Oracle化,重构为微服务+容器化架构,容器化部署比例达70%,资源利用率从35%提升至72%,部署效率提升300%。


