岗位职责日常运维:通过专业工具 (如 Nagios、Zabbix 等)7×24 小时监控系统性能指标。每日巡检系统状态、进程、数据库连接、日志记录。故障处理:15 分钟内响应故障,定位硬件、软件、网络、配置等故障源,协同团队快速修复,重大故障汇报并复盘。性能优化:用性能测试工具分析数据找瓶颈,从服务器、数据库、代码等多方面优化,验证效果并持续改进。部署升级:参与新系统上线环境搭建及上线前测试。制定计划、与业务部门密切沟通,确保系统部署升级有序稳步推进。数据管理:制定应用系统的备份策略,异地存储备份数据,定期演练数据恢复,保障业务的连续性。安全保障:负责应用系统的安全防护工作,制定并执行安全策略,更新补丁,管理安全设备,定期审计和扫描漏洞,确保系统安全合规运行。技术支持:为公司内部用户提供应用系统的技术支持,对于无法立即解决的问题,要及时跟进并向用户反馈处理进度,确保用户满意度。从系统运维视角提供专业建议,确保系统设计具备良好的可运维性。协同开发团队、测试团队、产品团队优化系统。专业技能:1) 熟练掌握 Linux 和 Windows Server 系统管理,熟悉常用的命令行操作和系统配置工具。能够独立完成服务器的安装、配置、优化和故障排查。2) 精通一种或多种主流中间件(如 Tomcat、WebLogic、JBoss 等)的安装、配置、调优和故障处理,熟悉容器化技术(如 Docker、Kubernetes)者优先。3) 熟悉关系型数据库(如 MySQL、Oracle、SQL Server 等)和非关系型数据库(如 MongoDB、Redis 等)的管理和运维,具备数据库开发、性能优化、备份恢复、故障诊断等能力。4) 具备一定的开发能力,能够熟练使用至少一种脚本语言(如 Shell、Python 等)进行系统自动化运维和管理优先。