工作职责: 1. 负责公司平台的设计、部署和维护高可用性、高性能的分布式系统和服务。2. 负责平台应用上线评审、上线交付、配置变更、状态监控、容量管理、故障应急响应工作;3. 负责公司业务系统运维工作,提升业务稳定性和工程效率,与业务方保持高效沟通,建立良好合作关系;4. 负责相关系统的稳定性保障工作,并持续优化业务架构、用户核心体验等;5. 负责线上业务问题排障、性能瓶颈分析,攻克疑难杂症,并能沉淀知识输出;6. 负责线上重大问题排查,紧急事故处理,后续事故分析与优化;7. 负责应用故障演练、应急预案、SOP手册编写工作,确保故障时业务能快速恢复,确保运维安全,提升运维效率。;6. 建立健全数据运维、故障管理体系,提出自动化、智能化运维可行性思路,促进问题快速发现定位解决; 7. 通过技术手段,提前发现系统隐患或产品架构的不足,提出改进和优化建议,推动方案执行或负责实施; 8. 参与业务服务端架构的高可用设计和性能优化,保证高效、可靠的业务迭代。9. 参与到业务系统建设流程中,从系统设计到上线整个生命周期内保障系统可靠工作要求:1、计算机相关专业大专以上学历2、具备互联网公司、或者电商平台相关运维工作经验,3年以上工作经验;3、了解linux, nginx,redis,mysql等系统5、熟练掌握常用开源软件,了解最新运维技术及产品,具备应用系统、组件和中间件排障经验;具备容量规划、性能优化等经验;;4、熟练使用Shell、Pvthon等脚本语言:5、熟悉ITIL、SRE相关运维管理流程,具备企业运维规划与设计能力;