岗位职责:1. 负责公司公有云(如AWS、Azure、阿里云、腾讯云等)及私有化部署的运维管理,确保系统的高可用性和稳定性。 2. 规划、搭建、优化运维体系,包括服务器、存储、网络、安全等方面,保障业务连续性。 3. 监控和管理云平台资源,优化云成本,提高资源利用率。 4. 负责CI/CD自动化运维体系建设,优化部署流程,提高系统交付效率。 5. 进行系统安全加固,管理访问控制,提升运维安全性。 6. 处理突发故障,定位和分析系统异常,快速响应并解决运维问题。 7. 负责日志管理、监控报警、备份恢复等日常维护工作,制定应急预案并定期演练。 8. 与开发团队紧密合作,优化系统架构,提升服务质量和运维效率。 9. 持续跟踪***动态,研究并引入先进的运维工具和技术,提升整体运维能力。 任职要求:1. 本科及以上学历,计算机、信息安全、网络工程等相关专业,4年以上运维相关工作经验。 2. 熟悉公有云(AWS/Azure/阿里云/腾讯云等)和私有化部署方案,具备云平台运维管理能力。 3. 精通Linux/Unix操作系统,具备Shell/Python/Golang等至少一种脚本语言的编写能力。 4. 熟悉Docker、Kubernetes等容器化技术,具备K8s集群运维经验。 5. 熟悉自动化运维工具,如Ansible、Terraform、Jenkins等。 6. 具备丰富的网络、安全、存储等基础架构运维经验,了解高可用架构设计。 7. 熟悉日志管理(ELK、Prometheus、Grafana等)及监控系统运维。 8. 具备较强的问题分析与排查能力,能够高效解决复杂运维问题。 9. 责任心强,具备良好的沟通能力和团队合作精神,能够承受较大的工作压力。 加分项:- 持有云计算相关认证,如AWS Certified Solutions Architect、阿里云ACP、腾讯云TCA等。 - 具备大规模分布式系统运维经验,熟悉微服务架构。 - 了解DevOps理念,具备SRE(Site Reliability Engineer)相关经验。