工作职责:1.负责系统架构的设计与优化,确保系统和应用程序的高可用性、可靠性和性能,支持公司的快速发展和技术创新2.负责评估现有系统的性能瓶颈,提出改进建议并实施。3.负责开发和维护基础设施自动化工具,提升系统运维效率;4.负责快速响应和解决生产环境中的紧急事件,确保服务的持续稳定运行;5.负责设计和实施全面的系统监控和报警策略,确保及时发现和处理异常情况。6.持续关注和研究SRE领域的前沿技术和发展趋势,推动技术创新和应用。任职资格:1.计算机科学或相关专业本科及以上学历,具有5年以上SRE或相关领域的工作经验。2.精通Linux系统管理,熟悉Shell、Python等脚本语言,具备编写自动化脚本的能力。3.深入理解网络协议和分布式系统架构,具备大规模系统运维经验。4.熟悉云计算平台及其服务,具有云原生应用的设计和运维经验。5.具备强烈的责任心和抗压能力,能够独立处理紧急情况并快速做出决策。6.良好的沟通和团队协作能力,能够与跨部门团队有效合作。