①、结合应用需求设计高扩展性、高性能、安全、稳定、可靠的系统架构;②、负责应用高可用建设和管理,包括限流、降级、容错、容灾、同城双活,确保应用的可持续性;③、负责部署、完善监控系统和运行平台,建立自动化运维体系;④、负责应用性能分析与系统优化,不断提高系统整体运行效率;⑤、负责应用上线评审、上线交付、配置变更、状态监控、容量管理、故障应急响应工作;⑥、负责运维规范、流程文档编制,并将其工具化、平台化,确保运维安全,提升运维效率;⑦、负责应用故障演练、应急预案、SOP手册编写工作,确保故障时业务能快速恢复;⑧、配合外部saas服务的运维交付和问题处理。⑨、配合产品线技术开发人员排查系统问题、优化系统性能。⑩、配合审计涉及的运维材料整理输出。