【工作内容】1、构建和维护基础设施及自动化运维平台:负责基础设施的建设与优化,满足开发及业务需求,通过自动化工具实现高效运维,提升运维效率和系统稳定性。2、设计和维护CI/CD流程:构建和优化持续集成与持续交付流水线,确保代码的质量和快速部署,提升开发和运维团队的协作效率。3、保障系统和环境的稳定性与安全性:监控和维护生产、开发、测试环境的稳定运行,通过有效的网络和安全策略保障系统的安全性,及时处理系统故障和疑难问题。4、撰写和维护技术文档:负责撰写运维手册、故障报告等技术文档,确保知识共享与传递,支持团队内部培训和技术积累。【任职要求】1、熟悉网络和安全相关知识,能够分析网络流量和排查常见网络问题(如丢包、延迟、DNS解析等),熟练配置路由器、交换机、防火墙,掌握VLAN划分、VPN配置、IP地址规划、NAT转换等技术,了解主流安全厂商产品(如态势感知、日志审计、行为分析、防病毒系统),有信息安全实战经验优先。2、熟悉Linux和Windows操作系统,能够熟练操作主流发行版如CentOS/Ubuntu/Debian/Win Server,了解国产化信创系统(如openEuler、统信UOS)的部署和运维优先。3、熟悉机房的各种硬件设备和基础设施,能完成服务器、交换机、防火墙等设备的日常巡检、安装、调试、维护和故障处理。 4、熟悉容器化和容器编排技术,熟练使用Docker、docker-compose,了解镜像构建、优化及容器安全加固,熟悉K8s集群的部署与运维,能处理节点扩容、Pod调度、网络策略配置等问题。5、熟悉CI/CD工具链,能够搭建和维护持续集成/持续交付流水线,熟悉Jenkins、GitLab CI/CD,熟悉代码质量扫描工具(如SonarQube)及其集成。6、熟悉主流云服务和多云场景运维,熟悉阿里云、华为云等云服务提供商的产品(如ECS、OSS、RDS、VPC、负载均衡等)7、熟悉微服务架构及其运维,熟悉微服务相关中间件(如NGINX、MySQL、Redis、Nacos、RocketMQ、Kafka等)的高可用部署和性能优化,能够协助开发团队进行故障排查,了解微服务的分布式追踪(如SkyWalking)和服务治理。8、熟悉监控和日志管理,熟练使用常见监控组件ELK、PLG、Zabbix等,能够搭建和优化监控报警机制,包括系统资源、网络流量、应用性能和业务指标的监控。 9、熟悉脚本编程和自动化运维,能基于Shell、Go、Python中任一语言编写运维脚本,完成任务自动化(如批量部署、巡检、日志分析等),熟悉IaC工具(如Terraform、Ansible)优先。10、具备良好的文档编写能力,能够撰写运维手册、故障报告、项目方案等技术文档,具备良好的沟通能力,拥有运维相关项目的实战经验的优先。11、对新技术、新工具保持敏感性,能够快速学习和应用到实际工作中,具备较强的抗压能力,能够在紧急情况下快速响应并解决问题的优先。