岗位职责1. 搭建算法训练平台、MLOps环境;2. 配置多模态数据存储系统与权限控制;3. 管理容器化部署集群、GPU调度平台;4. 实现日志分析、异常检测、可视化工具集成;5. 支持仿真平台运行环境部署与资源监控;6. 编写SOP与上线脚本;7. 提供平台安全与数据冗余方案。任职资格教育背景: 计算机科学、信息系统、云计算或相关领域的本科及以上学历。经验: 3年以上IT基础设施搭建与运维经验。AI平台专长: 在构建和管理算法训练平台和MLOps环境方面具备丰富经验。分布式系统: 精通配置多模态数据存储系统(如Ceph)和大型数据集的访问控制。精通管理容器化部署集群(如Kubernetes - K8s)和GPU调度平台(如Slurm)。监控与自动化: 具备实现日志分析、异常检测和可视化工具集成的经验。能够编写SOP和在线脚本以实现自动化。安全与冗余: 了解平台安全和数据冗余解决方案。领域特定经验: 具备管理AI/ML平台IT基础设施的经验,特别是支持自动驾驶开发和仿真的平台。