岗位职责:1. 负责公司云平台基础设施、各项服务、业务的监控、告警平台的搭建和维护2. 负责公司云平台上各类故障问题的处理和跟踪3. 负责公司云平台上各类服务器费用的分析和优化4. 负责公司云平台的基础设施的架构的规划和搭建岗位描述:1. 本科及以上学历、3年及以上的运维工作经验。2. 熟悉主流操作系统(如Linux)的管理和维护,掌握网络配置、系统优化、备份恢复等技能。3. 熟悉Docker、K8s相关监控、日志、报警等运维体系,能够帮助完成各个系统的部署、调试、排查等4. 熟悉aliyun、AWS等云平台各种产品,做好监控、运维等工作5. 熟悉至少一种主流编程语言,如 Python、Go、Java 等,完成公司部分内部运维工具的开发6. 具备较强的故障排查、解决问题能力,较强的团队合作和沟通能力,能够与开发团队、业务团队紧密协作7. 能具备一定的安全相关工具研究经验者优先