岗位职责:1.负责公司服务器、网络设备的日常运维及管理,确保系统的稳定运行。2.监控系统性能,及时发现并解决系统故障,保障业务的连续性。3.参与系统架构的设计与优化,提高系统的可用性和扩展性。4.配置和管理数据库,确保数据的安全性和完整性。5.制定并实施备份和恢复策略,防止数据丢失。6.协助开发团队进行系统部署和发布,提供技术支持。7.编写和维护运维相关文档,提升团队的知识共享。任职要求:1.至少5年以上运维相关工作经验。2.能够独立负责项目中的全部运维、机器、网络等建设。3.熟悉Linux/Unix系统,具备系统故障排查能力。4.熟练掌握Shell、Python等脚本语言,能够编写自动化运维脚本。5.熟悉网络协议及网络设备的配置与管理。6.具备良好的沟通能力和团队合作精神,能够承受一定的工作压力。7.有云计算平台、英伟达、华为GPU服务器和集群运维经验者优先。