岗位职责:1、负责公司云基础设施(AWS/阿里云)日常运维管理,合理优化服务架构,提升资源利用率,降低运营成本;2、分析和深入发掘现有系统的不足,定位系统瓶颈,提高系统性能和稳定性;3、建设监控运维及容灾体系,提升可靠性和稳定性,保障系统SLA;4、设计、实施和管理故障演练注入,以评估系统的容错性和应急响应;5、制定优化运维流程规范并推动落地,包括容量规划、交付部署、变更升级、容灾备份、监控告警、事故响应处理等;任职资格:1、统招本科及以上学历,计算机、网络、信息技术或相关专业,3年以上运维经验;2、精通AWS/阿里云等云厂商产品及服务;3、熟悉Linux操作系统基础扎实,对操作系统原理有一定了解; 4、熟悉TCP/IP、HTTPS等网络协议,具备良好的系统和网络运维能力,较强的故障分析及系统化问题解决能力;5、掌握至少一种脚本语言(Shell、Go、Python等),并有相关开发经验;6、熟悉常用的故障排查工具,对性能问题定位和故障排查有系统方法论;7、具备从0-1 SRE质量体系建设优先;能力素养:1、有强烈的求知欲、好奇心和进取心;2、具备良好的沟通能力,团队配合意识强。