一、岗位职责1、战略规划与执行:协助部长制定云基础架构运维的长期战略规划,包括技术选型、资源规划、成本优化等,并监督实施。2、团队管理:领导并培养一支高效的运维团队,包括人员招聘、技能培训、绩效评估及团队建设,确保团队高效协作。3、云平台运维:熟悉并管理主流云平台(如AWS、Azure、阿里云、腾讯云等)的部署、配置与优化,确保云资源的有效利用和安全性。4、硬件设备管理:深入了解服务器、存储设备、网络设备等硬件参数,制定并实施硬件维护与升级计划。5、云资源与应用服务运维:负责云资源的分配、监控、故障排查与恢复,以及应用服务的部署、升级与性能调优。6、运维技术创新:推动运维自动化、智能化工具的应用,如CI/CD流程、监控预警系统、自动化脚本等,提高运维效率与质量。7、网络安全运维:精通网络安全技术与策略,确保云平台及应用服务免受攻击,定期进行安全审计与漏洞修复。8、应急响应与灾难恢复:建立并完善应急响应机制,制定灾难恢复计划,确保在紧急情况下能快速恢复服务。二、任职要求1、教育背景:计算机科学、信息技术或相关领域本科及以上学历。2、工作经验:至少8年以上IT运维经验,其中5年以上云基础架构运维管理经验,有大型互联网公司或云服务提供商工作经历者优先。3、技术能力:1)精通主流云平台技术架构与运维管理,主流云平台的架构、功能和操作,具备丰富的云平台运维实践经验,如 AWS、Azure、阿里云、腾讯云、华为云等;2)熟悉各类硬件设备参数,具备硬件选型与故障排查能力;3)精通Linux系统管理、虚拟化技术(如KVM、VMware)、容器技术(如Docker、Kubernetes);4)深入了解网络原理,熟悉TCP/IP协议栈,具备网络故障排查能力;5)精通主流的运维技术,如 Shell、Python 等脚本语言,Ansible、Puppet 等配置管理工具,Zabbix、Prometheus 等监控工具6)熟悉网络安全运维管理技术,包括防火墙、入侵检测、VPN、访问控制等,具备网络安全漏洞排查和修复能力7)了解云计算相关的开源项目和技术,如 OpenStack、Ceph 等。4、具备较强的分析问题和解决问题的能力,能够快速定位和解决云基础架构和应用服务中出现的各种故障和问题。有良好的应急处理能力,在突发情况下能够迅速制定并执行有效的解决方案,保障业务的连续性。5、具备出色的团队管理能力,能够激发团队潜能,促进跨部门合作,有效沟通协调。