1、负责大语言模型的训练与评估数据集构建、模型的训练与微调技术体系的搭建,以及面向业务场景的落地;2、设计、开发和优化生成式大模型,应用于虚拟环境、机器人控制系统及其他实际场景;3、深度参与数据构建、模型训练、评测与部署,支持机器人实机交互、操作与动作生成等关键任务;要求:1、计算机科学、人工智能、自然语言处理、自动化等相关领域硕士或博士学位;2、精通C++/Python编程语言等,具有扎实的代码功底3、深入理解transformer架构体系、PyTorch 或 DeepSpeed 、megatron等深度学习训练框架,具有本科毕业+ 3年及以上或博士毕业3年以上算法实践及优化经验 ;4、掌握生成式大模型的基本原理,熟悉 MotionGPT、Llama2、Mixtral 等预训练模型以及预训练与微调流程;5、熟悉视觉和文本多模态大模型,在相关领域有影响力的Paper,有互联网或科技公司高阶技术岗位任职经历者优先。6、优秀的团队合作能力和沟通能力,能够独立解决复杂问题。