一、岗位职责:负责行业大模型的研发与优化任务,根据行业场景选择合理的技术架构路线并进行全生命周期的架构落地,包括但不限于:大语言模型架构设计,训练优化,性能评估,提升模型语义理解、指令遵从、逻辑推理等通用能力;基于大语言模型的检索增强技术研发,包括大模型领域适配、知识对齐、知识增强等,在机械,制造,高端装备等场景构建专业知识驱动的智能体应用;大规模数据的收集,清洗,预处理工作,为模型训练提供高质量数据支持;运用多模态(图片,语音,视频等)生成算法模型解决行业问题;持续关注行业最新动态和研究成果,不断推动大模型技术的创新和发展。领导交办的其他工作。二、岗位要求]:1、有丰富的深度学习、多模态、NLP、大模型等领域的相关模型训练和调试经验;熟悉最新的Transformer、diffusion等模型架构,熟悉PalmE,ChatGPT,RT1,RT2,octo,openvla,3DGS、NeRF、SAM等前沿方法;2、优秀代码能力,数据结构和基础算法功底,熟练掌握Python/Pytorch/TensorFlow;3、有相关项目经验或者在顶会顶刊(CVPR,ICCV,TRO,RSS,ICRA,IROS等)上发表过高水平论文优先;4、在大数据处理、大规模分布式计算、分布式训练等领域有科研或实践经历;5、具有较强的创新意识和探索精神,充满激情,热爱学习,紧跟行业发展趋势;6、具备良好的团队合作和沟通能力,能够清晰地表达自己的想法和观点,撰写高质量的技术文档。7、理工科相关专业,硕博及以上学历。