岗位职责:负责设计、开发和优化AI大模型,建设RAG体系,对RAG链路中的重要模块进行优化,如检索、生成及融合策略,提升模型的性能效果负责大模型预训练、微调、RAG等技术的研发与优化;推动LLM技术的产品化落地,涵盖智能问答、文本生成等应用场景;研究和引入最新的深度学习技术、算法和框架,提升大模型的性能、效率和可解释性;参与数据集的构建、清洗、标注和评估,确保训练数据的质量满足模型训练需求;跟踪AI领域最新动态,撰写技术文档,分享技术经验和研究成果。任职资格计算机、人工智能、数学或相关领域硕士及以上学历,具有深厚的理论基础和专业知识,3年以上NLP/语言大模型研发经验,985院校毕业优先 ;熟悉自然语言处理相关理论,熟悉Transformer/BERT/GPT等基础模型结构,有LLM模型训练和调优经验熟悉 PyTorch,TensorFlow等深度学习平台,熟练掌握Python/C++编程语言;具有大模型训练及应用开发经验,如语料清洗、预训练、指令微调、Rag、强化学习、内容安全等;具备良好的逻辑思维能力,擅长具体问题具体分析,具备高效的工程动手能力,良好的团队协作能力。具备优秀的沟通能力,学习能力,有强烈的上进心和主动性,能够与其他部门紧密合作,共同推动项目进展;在NLP***会议上有论文发表者优先,参与过有影响力的开源项目开发者优先。