岗位职责:1、负责跟踪大模型前沿技术动态,特别是在LLM(大型语言模型)、多模态学习等领域,参与关键技术的研发攻关;2、在大型预训练、微调、Agent、RAG(检索增强生成)等方向,负责算法、数据、评测等维度的创新和优化工作;3、参与工业相关大模型的研发,包括数据处理、预训练、微调、RLHF(强化学习与人类反馈)、模型评估等环节,以提升大模型性能,满足工业应用需求;4、开展大模型量化、剪枝、蒸馏等模型压缩技术的研发,以提高模型的效率和可部署性;5、探索大模型在工业领域的应用方向和场景,参与产品设计、现场落地验证等工作,协助构建完整的系统解决方案。任职要求:1、教育背景:硕士研究生及以上学历,专业要求为数学、计算机科学、人工智能或相关领域;2、工作经验:具有深度学习、强化学习、知识图谱、自然语言处理等相关领域的经验,有大模型研发项目经验者优先考虑;3、技术技能:熟练掌握Tensorflow/Pytorch等深度学习框架,具备良好的编程能力;4、行业知识:对工业场景有一定的了解和兴趣,能够将大模型技术应用于实际工业问题;5、个人素质:具备良好的学习能力、抗压能力、沟通协调能力以及团队合作精神,能够适应快速变化的工作环境。