工作描述云运营工程师/系统工程师负责管理和监控我们在云平台和本地的基础设施,确保我们SaaS解决方案的系统可操作性、可用性、稳健性和安全性。他/她还将通过评估、测试、配置、部署和维护应用软件、操作系统、网络设备、备份和系统管理工具来监督基础设施的改进。角色和职责管理和持续监控云平台和内部部署的所有系统和基础设施确保云服务器和公司SaaS应用程序的可操作性、正常运行时间和健壮性安装,配置,测试和维护操作系统,应用软件和系统管理工具维护安全、备份和冗余策略协助识别,排除故障,缓解和记录任何可能发生的事件与供应商联系解决问题需求计算机科学、信息技术或相关专业本科以上学历5年以上公共云环境(AWS、Azure、GCP或阿里云)管理和优化经验具备服务器管理(Windows和Linux), PostgreSQL数据库服务器和网络组件(如防火墙,路由器,负载平衡器等)的丰富经验。具有Linux环境下的脚本/编程经验有使用基础设施即代码(IaC)工具的经验,如Terraform和Ansible具有容器化技术(如Docker和Kubernetes)的经验具有Zabbix, Prometheus和Grafana等监控系统的使用经验熟悉CI/CD工具,如Jenkins, GitLab CI/CD或CircleCI具有桌面支持(Windows和Mac), Microsoft Active Directory, Office365的经验积极主动,能够在很少的监督下独立工作团队合作,积极思考和结果导向期望技能和经验良好的英语口语和书面表达能力良好和专业的内部和外部沟通技巧具有在不同地区与全球团队合作的经验较强的故障排除和分析能力具备以下方面的设置、配置和安全调优知识:Docker和Kubernetes集群Web或应用服务器网络,防火墙和VPN负载平衡