职位概述1. 推动产品稳定性的系统性建设,包括故障预防(演练)、发现、止损、恢复等2. 对云基础、云原生底层技术架构有广泛了解,负责云上云下运维管理制度的制定和落地3. 负责7*24小时IT运维指挥中心技术能力提升,特别结合AI工具不断提升工单处理率和服务满意度职责范围86 运维标准与制度: 结合云基础、云原生底层技术架构,制定并落地云上云下运维管理制度、规范和***实践,确保运维工作的标准化和合规性。86 技术能力提升: 负责提升 7x24 小时 IT 运维指挥中心的技术能力,包括与AI工具的结合,不断提升工单处理效率和服务满意度。86 容量管理: 负责容量规划、监控和优化,确保 IT 资源能够满足业务需求,并提前预警和应对容量瓶颈。86 ITSM&CMDB: 支持ITSM&CMDB升级项目落地,CMDB+自动化运维+统一监控+ITSM的四位一体架构,形成闭环管理生态86 持续改进: 通过数据分析、用户反馈等方式,发现运维流程中的问题和改进点,推动持续改进,提升运维效率和服务水平。任职条件86 教育背景: 计算机科学、信息技术或相关专业本科及以上学历。86 经验要求:87 5 年以上 IT 运维管理经验,熟悉 ITIL 框架及相关流程(事件管理、变更管理、容量管理、问题管理等)的实施和优化。87 有 7x24 小时监控运维团队协作或管理经验者优先。87 有云计算环境(如阿里云、Azure)运维经验者优先。86 技术能力:87 具备扎实的IT技术基础, 熟悉云原生技术栈(如 Docker、Kubernetes、微服务等)者优先。87 有一定的脚本编写能力(如 Python、Shell 等),能够进行自动化运维。87 了解监控工具和日志分析工具(如 Prometheus、Grafana、ELK Stack 等)。87 熟悉了解大模型相关技术和应用86 专业技能:87 熟悉 ITIL流程体系,具备ITIL相关认证者优先。87 具备良好的流程设计、优化和执行能力。87 具备良好的问题分析和解决能力,能够快速定位和解决线上问题。87 具备数据分析能力,能够通过数据分析发现运维流程中的问题和改进点。86 综合素质:87 具备良好的沟通协调能力和团队合作精神,能够与不同团队有效沟通。87 具备较强的抗压能力,能够在紧急情况下快速响应和处理问题。87 具备良好的学习能力和持续改进意识,能够不断学习新的技术和方法。87 具备良好的文档编写能力,能够编写清晰、规范的运维文档。