工作职责:1. 行业大模型训练与调优主导单模态(NLP)、多模态(VL)大模型的分布式训练,包括千卡集群的预训练、全参微调、LoRA/QLoRA等技术方案;研发强化学习(RLHF)、偏好对齐(DPO)、知识蒸馏等前沿算法,提升行业场景下的模型训练效率与精度(目标30%+提升);探索大模型智能体(Agent)架构设计,包括自主决策、工具调用(Tool Calling)、长上下文建模等能力构建;2. 训练体系技术攻坚设计高质训练数据生成系统(数据清洗、合成数据生成)、自动化参数调优框架及多维度评测体系(精度/推理成本/响应速度);开发大模型训练-推理协同优化方案,解决显存效率、吞吐量等工程化瓶颈。3. 负责各类型的运筹优化模型,如库存控制、生产排程、物流优化,以及模拟仿真等,了解各模型的使用场景与运算效率,能选择合适的算法模型满足业务需求。任职要求:1. 计算机/数学相关专业本科及以上学历,5年+AI算法经验,3年+大模型(NLP/多模态)实战经验;2. 精通Transformer等模型原理,对Qwen、Deepseek等开源模型有调优经验;3. 熟练使用Deepspeed/Megatron进行千亿级模型分布式训练,掌握ZeRO、梯度检查点等显存优化技术;4.有丰富的C++、Java或Python等主流语言的编程经验,扎实的排程算法与数据结构功底,优秀的机器学习基础,良好的数学和统计基础; 5.能熟练调用优化求解器及相关接口,如CPLEX,Gurobi,SCIP等,或完整实现过启发式算法的开发; 6.对解决挑战性问题充满热情,抗压能力强;良好的理解与表达能力,优秀的团队合作和自我驱动能力。