职位描述
本职位负责确保团队内部软件系统的稳定性、性能与安全性。主要工作包括管理维护区块链节点、Web3应用及官方网站等核心组件,全面监控系统运行状态,及时排查技术故障。同时需设计部署自动化工具以优化运维流程,提升系统可靠性。该岗位需跨部门紧密协作,实现软件基础设施的无缝集成与持续改进。
核心职责
- 7×24小时监控维护区块链节点、Web3应用及团队网站的稳定性,确保高可用性与最优性能
- 为软件产品及其运行环境部署全方位监控体系,包括实时日志记录与告警机制
- 诊断并解决分布式系统中的复杂技术问题,重点开展根因分析与系统恢复
- 开发自动化脚本工具执行日常维护任务,减少人工干预并提升运维效率
- 协同开发与安全团队增强系统容错能力,优化资源配置,确保符合行业标准
- 编写系统配置文档、事件报告及操作手册,支持知识共享与审计需求
- 持续跟踪新兴技术与行业趋势,提出系统优化与扩展的创新方案
任职要求
- 具备系统运维与DevOps实践经验,熟悉区块链基础设施及Web3技术栈
- 精通Linux/Unix操作系统、Shell脚本及Ansible/Terraform等自动化框架
- 深入掌握Prometheus/Grafana/ELK等监控工具及日志管理系统
- 了解区块链协议、智能合约交互及去中心化应用(dApp)部署流程
- 出色的分布式系统故障排查能力,能快速解决复杂问题并最小化停机时间
- 熟悉AWS/Azure/GCP云平台及Docker/Kubernetes容器化技术
- 能够设计实施CI/CD流水线,实现自动化测试、部署与版本控制
- 具备优秀沟通能力,可协同开发者与利益相关方进行技术决策
- 掌握Python/Go/JavaScript等编程语言,能开发定制工具实现系统集成
- 了解漏洞管理、访问控制及数据加密等安全防护最佳实践