工作职责:1. 容器平台运维: ◆ 设计、搭建和维护高可用的容器平台基础设施,确保平台稳定性和可靠性。◆ 管理Kubernetes集群,包括版本升级、故障排查和性能优化。2. 自动化工具开发: ◆ 领导团队开发、维护和优化自动化工具,促进各项运维任务的自动化执行。◆ 设计和实施弹性伸缩、自愈和灾备恢复工具,提高系统的自动化治理水平。3. 监控和告警: ◆ 设计并实施系统监控、告警和日志分析系统,确保对系统状态有全面的实时了解,对故障快速响应。4. 安全和合规性: ◆ 负责容器平台的安全管理和合规性,确保符合公司的安全标准和政策。5. 团队领导: ◆ 领导容器平台团队,帮助团队成员提升技能,制定运维策略和规划未来发展方向。任职资格:5年以上的云计算、容器化和自动化运维经验,有以下相关工作经验更佳: ◆ Kubernetes集群管理经验◆ 熟悉Kubernetes的系统架构和编程范式,有Operator扩展或相关产品研发经验优先;◆ 对Linux系统有深入的理解,熟悉docker及相关的网络和存储技术,有生产环境下的开发运维经验优先 ◆ 出色的团队领导能力和沟通能力,具备卓越的问题解决和决策能力◆ 深入理解云原生技术栈,熟悉两个或以上技术域:K8S资源调度、ServiceMesh、多运行时、Serverless 、容器运行时、离在线混部、容器网络SDN 、深度可观测性;◆ 待人真诚、乐于协作、有责任心、有创新精神