工作职责:1.部署和管理包括DeepSeek、LLaMA, CLIP family等在内的专有和开源大语言模型/多模态大模型,确保它们的最优性能,整合到解决方案中;2.负责对大语言模型/多模态大模型进行训练或者微调,以提高其在具体业务场景的上的性能;3.对训练及微调过程中的数据进行预处理和分析,确保数据集的质量和适用性;4.设计、开发和优化生成式大模型,应用于虚拟环境、机器人控制系统及其他实际场景;5.负责跟进领域最新进展,预研和评估大模型在机器人领域的应用,如RDT、RT-2、π0。任职要求:1.计算机、人工智能、数学等相关专业硕士及以上学历,具备深度学习,大语言模型,多模态大模型等领域的相关背景知识和落地经验,或有相关实习经验的应届硕士毕业生;2.熟悉深度学习框架(如PyTorch、TensorFlow等)以及常用的模型评估和调优技术,熟悉Transformer、BERT、GPT系列、CLIP、BLIP等模型,熟练使用 Pytorch, Huggingface Transformer,deepspeed 等深度学习工具;3.熟练掌握数据处理和分析技能,能够处理和分析大规模的文本/视觉数据集;4.有过基于深度学习/ 强化学习/模仿学习的机器人操作算法经验优先;5.在AAAI、CVPR、ACL、ICRA、IROS等国际***会议上发表论文者优先。