岗位职责:1、大语言模型(LLM)的训练和调优:结合公司大语言模型的应用场景,进行模型训练和调优,包含预训练、持续训练、SFT、RLHF等,以提高模型在处理自然语言处理任务(如文本生成、机器翻译、问答系统等)时的性能,支持应用场景的落地; 2、大语言技术研究与创新:前沿技术跟踪,密切关注自然语言处理、深度学习领域的最新研究成果,如在预训练模型、模型压缩、多模态融合等方面的进展,将有潜力的新技术引入到公司的大语言模型研发项目中,保持项目的技术先进性。岗位要求: 1、具有硕士/博士学位,专业背景包括自然语言处理、机器学习、数据挖掘、人工智能等相关领;2、熟练掌握深度学习框架如Tensorflow、Pytorch等,具备扎实的编程基础和独立的算法实现能力,熟悉langchain并具备相关项目经验者优先考虑; 3、具备大规模语言模型(LLM)的实操经验,有参与大型模型预训练、SFT、RLHF等项目的经验者优先;4、深入研究和实践自然语言处理、文本生成等领域,并有相关经验; 5、具备良好的逻辑分析能力和数理基础,对算法原理及应用有深入理解。有较强的自学能力和解决问题的能力,对前沿创新技术有热衷钻研的态度。