岗位职责:1、负责K8s集群的规划、部署、配置、优化、监控、告警及排障;2、负责云平台、服务器集群等基础设施的运维与安全,包括系统架构设计、部署、优化、维护及安全;3、主导处理云平台运维的技术难题和重大故障,并沉淀云平台运维的解决方案;4、负责运维平台工具的管理、维护,包括基础设施管理、构建发布、配置管理、监控告警等系统的设计和开发;5、推进自动化运维体系建设,提升运维工作效率,如使用Saltstack、Puppet、Ansible等自动化运维工具;6、深入研究运维自动化技术、虚拟化技术、监控技术、网络技术等,并探索、研究新的运维技术方向;7、负责运维开发体系规划,包括架构设计、自动化脚本编写等,以提升运维的智能化水平;8、负责公司Linux服务器的配置、维护、监控、调优和故障排除,确保服务器性能稳定;9、负责业务系统和应用的变更、升级及优化工作,包括数据库、中间件等组件的调优;10、监控信息系统的安全状况,定期检查系统日志,发现异常行为并及时响应;11、使用专业的安全工具检测系统漏洞,预防潜在的安全威胁;12、配置和管理安全系统,如开源IPS/IDS等。任职要求:1、本科及以上学历,计算机、软件工程、通信工程等相关专业;2、5年以上的相关工作经验,有K8s集群管理和运维经验;3年以上Linux系统运维经验,熟悉Linux/Unix系统及其常用服务的安装配置;2年以上信息安全系统实施及运维经验;3、精通Shell、Python等脚本语言,能够编写自动化运维脚本。精通Docker、Kubernetes等容器化技术,以及VMware、KVM等虚拟化技术。熟悉Zabbix、Nagios、Cacti等监控工具,有二次开发经验者优先;4、熟悉云计算技术,如AWS、Azure、阿里云、Openstack等云平台的运维和管理。有持续集成和持续交付经验,熟悉CI/CD流程和工具,容器及自动化发布;5、熟悉TCP/IP协议栈、路由与交换技术、网络安全等基础知识;具备一定的文档编写能力,能够编写清晰明了的运维文档和操作手册。