岗位描述:1、参与内部大型高可靠的自动化、智能化K8S容器训练平台运维体系研发建设;2、负责运维自动化平台容器管理和编排/智能监控告警以及定位/中间件管理等系统的开发与维护3、制定运维计划,深入各运维技术子方向,提供平台化运维解决方案并持续负责优化4、持续跟进K8S平台架构应用部署以及平台组件优化,跟进K8S运维工具开发5、负责大规模服务器配置管理、基础软件安装及性能调优,自动化应用的部署6、参与SRE轮值ONcall,完成运维开发相关工作文档编写任职资格:1、统招本科及相关专业,3年以上go语言运维自动化平台研发经验,熟悉软件开发和系统架构;有自动化运维的经验,精通Linux操作系统2、熟练掌握GOlang开发,有使用Grpc/GIn等框架开发经验,可以熟练使用VUE3.熟悉基本的数据结构,熟悉基本的网络知识,熟悉项目中 MongoDB/Mysql等数据库使用4.熟悉底层物理网络,对Linux中常见接口配置Bond、Vlan、Vxlan、Macvlan、Tap等熟悉,熟悉 DHCP、DNS等常见协议,擅长基于Tcpdump/ Wireshark 分析网络问题5.精通 K8S,具备基于K8S二次开发能力,基于 CRD 或自定义Apiserver,实现自定义Controller- manager 完成自定义资源管理6.掌握 Prometheus/Alertmanager监控告警平台,并基于API和Webhook实现自定义告警通知7.基于 Ubuntu、Centos 做系统二次封装,掌握基于 PXE kickstart自动化装机流程