岗位说明岗位职责:负责应用系统的稳定运行,包括:中间件、应用程序等。负责应用系统的部署、变更、发版、漏洞修复及基线验证。负责应用系统的监控、巡检、事件响应和故障处理。负责应用系统的应急恢复流程的规划、实施。负责应用系统应急处置中系统部分的问题分析、定位及操作。负责应用系统的容量、可用性进行分析、设计、规划和实施。负责应用系统配置项的完整性、准确性和及时性。负责配合新上线应用系统加入监控平台。负责应用系统备份需求的提出。负责核工业数据中心云平台资源对接和云资源管理。负责运维自动化建设,提升整体效率和稳定性。 任职要求大学本科及以上学历,计算机或者相关专业;熟悉阿里云,腾讯云, AWS中至少一种云平台运维管理;深入理解linux系统,运维体系结构,精于容量规划、架构设计、性能优化;精通Docker、 K8S架构和技术原理,并有大规模使用、排错和优化;精通prometheus、 ELK、 Zabbix等的配置、排错和优化;精通 CI/CD 相关工具,熟悉gitlab、 jenkins、 Maven、 jira等工具的使用;责任心强,具备良好的团队合作精神和承受压力的能力;有5年以上的应用运维或系统开发经验,有大型互联网公司运维经验者优先