职位描述:招聘一名资深的 Kubernetes 工程师。持有CKA或CKAD或CKS证书,后者更佳。该岗位的主要职责是维护和优化 Kubernetes 集群的稳定性与性能,同时开发和维护周边的自动化运维工具。应具备深入的 Kubernetes 知识,并能够在复杂环境中解决运维挑战。主要职责:负责 Kubernetes 集群的搭建、维护、优化和故障排查。监控 Kubernetes 集群的健康状况,并优化集群性能和可用性。编写和维护集群运维自动化工具,提升运维效率。深入分析集群中容器、网络、存储、资源等方面的问题,提供***实践和解决方案。协助团队进行故障恢复、系统备份恢复、系统升级等工作,确保系统的高可用性。与开发团队紧密合作,提供技术支持,帮助团队解决在容器化应用部署中遇到的挑战。不断跟踪 Kubernetes 相关技术的最新发展,并引入新的***实践。岗位要求:计算机科学或相关专业本科及以上学历。要求 5年以上 IT 基础设施及 DevOps 相关工作经验,至少 3年 Kubernetes 集群运维经验。熟悉 Kubernetes 内部架构、部署模式、调度策略、网络、存储等模块,具备深入的集群运维能力。熟练使用 Kubernetes API、kubectl 命令行工具,具备定制化运维工具开发能力。深入了解容器技术(如 Docker)及容器编排系统。具备云计算平台(如 AWS、GCP、Azure)上的 Kubernetes 集群管理经验。有使用 Helm、Istio、Prometheus、Grafana 等 Kubernetes 周边工具的经验。精通至少一种脚本语言(如 Bash、Python),并具备一定的编程能力(如 Go)。有较强的故障排查能力,能够独立解决集群中出现的复杂问题。良好的团队协作精神和沟通能力,能够与开发、运维等团队密切合作。有云原生架构、大规模分布式系统经验。具备丰富的网络存储经验,包括但不限于 NFS、Ceph、iSCSI 等存储解决方案的配置、优化和故障排查。