岗位职责:1、负责数据中心机房日常管理,包括故障处理、配置管理、变更管理、时间管理、风险管理和问题管理;2、负责建设计高效及优化的系统监控,熟悉Zabbix、Cacti等工具的部和使用;3、保障公司各系统,网络安全稳定的运行;4、负责对运维中问题的跟踪并最终解决、分析故障原因、提交故障报告;5、负责运维故障处理过程协调;6、达成SLA和OLA运维标准;任职要求:1、具备5年及以上IDC、系统(服务器、存储、交换机、负责均衡设备等)实施和运维经验、具有大规模计算机集群和IDC维护经验;2、精通Hyper-V\KVM\OpenStack\VMware等虚拟机化技术;3、精通IDC运维,具有规划、推进大规模业务交付的经验。了解常见硬件、包括服务器、网络设备、存储。4、具有Linux系统运维经验,操作系统调优和问题排查经验;具备Slurm、Gitlab等系统的搭建和维护经验;5、具有Windows系统运维经验,操作系统调优和问题排查经验;具备AD、DNS、DHCP、CA、NPS、DFS、WSUS、Printer、RDP、Cluster、Exchange等系统的搭建和维护经验;6、具有数据库的运维经验,具备SQL Server、MySQL等数据库的维护经验;7、精通Cisco、华为、H3C等主流厂商的路由器、交换机、防火墙、无线控制器等设备的配置及使用; 8、拥有至少一个主流网络设备厂家的认证(如:思科 CCIE能力认证、H3C H3CSE能力认证),有SDN/SD-WAN 解决方案经验者优先考虑;9、良好的需求分析能力,良好的文档编写能力。积累运维和开发经验并沉淀标准、专业的文档;10、良好的沟通协调能力,能够从大局考虑,和团队其他成员协作,达成卓越目标;11、具备至少一个公有云平台的搭建和维护经验(AWS、Azure、阿里云、腾讯云)。