工作职责:1、负责大规模Kubernetes集群日常运维工作,告警处理;2、负责可观测系统包括日志、监控、全链路追踪问题排查与优化;3、负责微服务管理和运维,包括服务部署、升级、问题排查和指导用户上云;4、负责云原生组件问题排查,持续跟踪AI智算、云原生及智能运维领域新技术,结合业务场景进行创新。任职资格:1、大专及以上学历计算机相关专业,5年以上工作经验,3年以上云原生运维经验;2、熟悉Kubernetes架构,掌握核心组件原理,有实际使用和运维经验;3、了解Golang、python和shell,能编写自动化脚本;4、全面了解linux系统原理和运维方式,熟悉DevOps流程,有较强的解决线上问题能力;5、熟悉云原生生态,了解Calico、Argo、Kubeflow、Koordinator、Istio等组件原理。