岗位职责:1.关注系统告警,依托各运维工具,对故障进行快速定界,及时组建故障作战室,准确调度各专业组核实处理相关故障,验证故障处理结果,对外反馈通报;2.优化故障标准,根据实际场景,优化已制定的故障标准;3.以业务连续性视角进行分析,确保现有可观测大盘指标准确、实时,推动SLO可观测性指标进行优化改进;4.站在业务连续性保障视角,以1-5-10为最终目标,站在实用、好用的角度,对现有平台提出优化需求,推动工具厂商自改并配合进行开发;5.配合各业务团队挖掘运维过程中的一些自动化需求,帮助实现自动化场景开发。岗位要求:1.大专及以上学历,2年以上运维工作经验,具备Python、go、SHELL开发能力的优先考虑;2.熟悉paas层相关的中间件技术栈,如,数据库服务(Oracle、MYSQL、Redis)、消息队列(RabbitMQ、Apache Kafka等)、缓冲服务(MemCache)、远程过程调用(RPC)中间件、Web服务器中间件(Nginx)软件负载类(HAProxy)、服务注册发现(ZooKeeper)、软件负载类(HAProxy)、服务注册发现(ZooKeeper);3.熟悉虚拟化、容器化等技术,熟练掌握Kubernetes、Docker技术。