岗位职责:1、系统维护与管理:负责云端及项目现场服务器、网络设备、存储设备等基础设施的日常维护和故障处理。监控系统运行状态,及时发现并解决潜在问题,确保系统稳定运行。进行系统备份与恢复,确保数据安全。2、应用部署与配置:根据需求部署和配置应用程序,包括数据库、中间件等。优化应用性能,提高系统响应速度和稳定性。3、安全管理:实施并维护网络安全策略,包括防火墙、入侵检测系统等。定期进行安全审计和漏洞扫描,及时修复安全漏洞。4、故障排查与恢复:快速响应系统故障,进行问题定位、分析和解决。制定并执行故障恢复计划,最小化系统宕机时间。5、性能优化:监控系统性能,分析瓶颈并进行优化。实施性能提升策略,如负载均衡、缓存策略等。6、文档与流程管理:编写和维护运维文档,包括系统配置、操作指南、故障处理流程等。参与制定和优化运维流程,提高团队工作效率。7、团队协作与沟通:与开发、测试等团队紧密合作,确保系统顺利交付和运维。及时向相关部门报告系统状态、故障情况及处理进展。8、持续学习与技术创新:跟踪最新的运维技术和工具,不断学习和实践。探索并引入新的运维方法和工具,提升运维效率和质量。任职资格:一、专业技能要求1、云产品熟悉度:深入理解云架构,熟悉阿里云产品的特性,包括ECS、SLB、RDS、K8S等。具备公有云、私有云或混合云的实际运维经验,熟悉云平台的日常搭建、监控、维护及管理等。2、系统操作与运维:熟练掌握Linux操作系统,包括网络、存储、vim操作、性能排查等各方面的命令。熟悉Windows操作系统,对Windows Powershell有基本了解。精通Docker技术,能够对Docker的复杂问题进行分析和解决。3、网络与安全:了解网络技术,包括TCP/IP堆栈、IP寻址、子网划分、CIDR等。熟悉阿里云及主流云平台的安全组、访问列表/防火墙规则等安全配置。4、数据库与存储:熟悉关系型数据库(Oracle、MySQL、SQL Server)和非关系型数据库(如Redis、MongoDB)的一种或多种。了解数据库基本原理,熟悉备份、恢复、主从复制等数据库运维技能。具备SAN的基本知识,熟悉VMWare或其他虚拟化技术。5、监控与日志分析:熟悉常见的开源监控和日志工具,如Prometheus、Grafana、ELK等。能够进行日常业务系统状态监控,预控/预警,问题排查及优化解决。6、自动化与CI/CD:熟悉自动化的CI/CD部署流程,了解Jenkins持续集成/持续部署工具。二、工作经验要求运维经验:要求具备至少2年以上的公有云运维经验,有阿里云运维经验者优先。项目管理经验:熟悉项目管理的相关知识,如进度、风险、成本、范围管理等。三、教育背景要求学历与专业:全日制一本本科及以上学历,计算机相关专业毕业。四、沟通协调能力要求沟通能力:具备良好的沟通协调能力和团队合作精神,能够与客户、开发团队、测试团队等多方进行有效沟通。文档能力:能够独立完成客户要求编写的可研、培训文档、技术方案以及各种项目相关文档。五、其他要求认证优先:持有阿里云ACP、ACE等认证者优先。抗压能力:能够承受一定的工作压力,具备较强的独立思考能力与抗压能力。持续学习:具备较强的学习能力,善于总结和发现问题,能够跟上云计算技术的快速发展。薪酬福利:十三薪、双休、六险一金、节假日生日礼物礼金、体检、带薪年假