岗位职责1)参与原生多模态大模型研发,包括MoE多模态架构、多模态强化学习框架、多模态长思维链推理能力优化、高质量数据合成、体验优化等,突破通用大模型在特定领域的能力和速度限制;2)负责原生多模态大模型高效率预训练,以及后训练探索,支撑多模态输入/输出、复杂任务均衡优化;3)探索在数据有限的情况下扩展多模态大模型的能力,包括但不限于强化学习、少样本学习和持续学习等方法;4)系统化定位模型在真实评测集下的能力缺陷,通过数据构建、合成、清洗或模型优化等方式进行改进。岗位要求1)硕士及以上学历,计算机视觉、语音、模式识别、自然语言处理、多模态、计算机科学或数学相关专业背景;2)具备扎实的代码基础,熟练掌握Python/Tensorflow/PyTorch等; 3)具备较强的团队合作能力和沟通能力。加分项1)在多模态/语言大模型、计算机视觉领域在国际***会议/期刊发表过高质量论文;2)对MLLM领域有深入的研究,对MLLM有优化设计或行业成功应用经验。