工作职责:一、技术支持工作1、负责生产环境系统的监控响应,预见性规避和降低系统风险,降低平台故障的发现时间,并缩短故障的响应和恢复时间。2、参与运维体系建设,不断优化各项工作流程,完善运维管理规范,保障运维质量。3、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。4、负责公司日常网络及各系统日常管理维护,支撑日常系统维护监控,提供IT软硬件方面的服务和支持,保证系统的稳定。二、质量优化管理1、负责公司业务系统的日常维护,新系统安装部署,研发版本上线,定期巡检,漏洞修复,安全防护。2、负责磐基云/Docker/K8s/rancher的实施交付、监控部署、故障诊断等工作,并能赋能同事;3、负责业务系统私有云与公有云对接,业务系统接口访问联调,网络策略的开通、测试、管理维护。4、参与制定和改进应急恢复流程,紧急问题能快速实现业务恢复。应对突发性故障。电话需保证7*24小时开机畅通。三、其他支撑保障1、负责完成客户和项目组交办各项任务,挖掘客户业务需求,为部门创造安全项目机会。2、负责重大活动保障工作,包括重要活动、重要会议以及节假日保障,特殊保障时期需要7*24小时值守。3、负责各类项目的工程建设现场实施,以及在项目实施阶段为用户提供技术培训。四、根据公司需要,完成领导交办的相关工作任职资格:任职条件:1、深入理解linux系统,运维体系架构,网络架构,熟练架构设计、容量规划、性能优化;2、熟悉云计算,熟悉云原生k8s生态,有生产使用和维护经验,有大规模k8s+docker设计和维护经验者优先;3、熟悉linux操作系统安装、配置,防火墙firewall策略开通,NFS,openssh升级,漏洞修复;4、熟悉常用中间件tomcat、nginx、redis的原理,能够独立完成集群部署、漏洞升级、应用版本上线,配置优化;5、熟悉交换机、防火墙的相关知识,熟悉4层、7层的网络原理,会使用curl,ping,traceroute,nmap,tcpdump 抓包处理等工具,完成网络策略的开通,业务联调;6、熟悉SQL编写,熟悉mysql,postgresql等数据库高可用原理,主从搭建,备份数据恢复日常操作。了解数据库优化策略,有清晰的故障排查思路;7、熟悉shell,ansible,python等运维脚本编程,有自动化运维经验者优先;8、具备较强的团队沟通协作能力、自驱力和技术热情,有3大运营商运维工作经验优先;9、5年以上运维工作经验,可带3人以上团队,统招本科及本科以上学历,计算机、通信、电子等相关专业优先。