岗位职责:1、负责K8s集群的规划、部署、配置和优化;设计和实施K8s的监控、告警和自动化运维工具。2、负责K8s集群的故障排除和性能调优;研究和评估新的K8s相关技术和工具,推动技术创新。3、负责云平台、服务器集群等基础设施的运维与开发工作,包括系统架构设计、部署、优化和维护。4、主导处理云平台运维的技术难题和重大故障,并沉淀云平台运维的解决方案。5、负责运维平台工具的管理、维护,包括基础设施管理、构建发布、配置管理、监控告警等系统的设计和开发。6、推进自动化运维体系建设,提升运维工作效率,如使用Saltstack、Puppet、Ansible等自动化运维工具。7、深入研究运维自动化技术、虚拟化技术、监控技术、网络技术等,并探索、研究新的运维技术方向。8、负责运维开发体系规划,包括架构设计、自动化脚本编写等,以提升运维的智能化水平。9、负责公司Linux服务器的配置、维护、监控、调优和故障排除,确保服务器性能稳定。10、负责业务系统和应用的变更、升级及优化工作,包括数据库、中间件等组件的调优。11、保障服务器与数据库安全,检查并消除安全漏洞,进行数据备份、数据监控、应急响应等工作。12、参与公司项目的规划、设计、实施和运维工作,确保项目顺利上线并稳定运行;与开发、测试等部门紧密协作,解决项目中遇到的技术问题。任职要求:1、本科及以上学历,计算机、软件工程、通信工程等相关专业;2、5年以上的相关工作经验,有K8s集群管理和运维经验;3年以上Linux系统运维经验,熟悉Linux/Unix系统及其常用服务的安装配置;2年以上信息安全系统实施及运维经验;3、精通Shell、Python等脚本语言,能够编写自动化运维脚本。精通Docker、Kubernetes等容器化技术,以及VMware、KVM等虚拟化技术。熟悉Zabbix、Nagios、Cacti等监控工具,有二次开发经验者优先。4、熟悉云计算技术,如AWS、Azure、阿里云、Openstack等云平台的运维和管理。有持续集成和持续交付经验,熟悉CI/CD流程和工具,容器及自动化发布;5、熟悉TCP/IP协议栈、路由与交换技术、网络安全等基础知识;具备一定的文档编写能力,能够编写清晰明了的运维文档和操作手册。