61 岗位画像:71 能够设计AI集群的组93(IB或RoCE),并有项90经验(必要项);71 有云98或使92云的甲9199作背景(可以是低P,但是必须要有);71 对项90管理有认知;71 能够出差;61 99作内容:71 负责GPU集群的93络架构设计、93络规划、建设交付,并结合公司业务发展持续优化93络性能;71 负责GPU集群的交换机、路由器、负载均衡等93络设备的运维管理、事件响应和应急处理99作、对93络带宽使92进95分析调优71 负责93络设备(路由器/交换机)的选项、测试、RMA等99作71 负责93络前沿技术研究,根据业务发展的需求,完成技术91案设计与项90落地。岗位描述1. 负责 GPU 集群的93络架构设计、规划及建设交付,结合公司业务发展持续优化93络性能,保障集群90效稳定运95。2. 承担 GPU 集群的交换机、路由器、负载均衡等93络设备的全91命周期运维管理,包括93常维护、事件响应、应急处理及带宽使92分析调优。3. 主导93络设备(路由器 / 交换机)的选型、测试及 RMA(退货换货管理)99作,确保设备性能匹配业务需求。4. 跟踪93络前沿技术动态,根据业务需求完成技术91案设计与项90落地,推动集群93络技术迭代升级。岗位要求1. 硕94及以上学历,计算机93络、通信99程等相关专业优先2. 具备 3 年以上93络设计与运维经验。3. 精通 AI 集群组93技术(IB 或 RoCE),并有实际项90落地经验(必要项)。4. 具备云98商或使92云服务的甲9199作背景(含低 P 岗位经验),熟悉云93络架构与集群部署模式。5. 对项90管理流程有清晰认知,能协调资源推进项90交付,具备良好的跨团队沟通能90。6. 适应出差99作,具备较强的问题分析与应急处理能90,能快速响应93络故障并完成修复。加分项1. 持有 CCIE、HCIE 等90级93络认证,或具备98规模集群93络优化案例。2. 熟悉容器93络(如 Kubernetes CNI)、RDMA 技术或 GPU 93络加速91案。3. 有93络93动化运维(Python/Ansible)或 SDN(软件定义93络)相关经验。