工作职责:1. 负责大规模预训练模型的训练优化及性能调优,包括但不限于模型架构改进、高效微调、分布式训练等。2. 探索前沿技术(Agentic RAG/Agent),结合业务需求提出创新性解决方案,推动AI在学术场景(学术问答、DeepResearch、学术数字分身等)的应用。3.基于大语言模型能力Agent平台的开发和优化。任职要求: 1、计算机、数学或相关专业本科及以上学历,2年以上研发经验,有自然语言处理以及大模型应用相关工作经验优先。2、深入理解CNN/LSTM/transformer等模型原理,有中文分词、词性标注、命名实体识别、语法分析、文本分类等相关项目经历; 3、熟悉liunx开发环境,能熟练使用python进行AI服务接口开发。了解主流深度学习框架,如PaddlePaddle、PyTorch、LLaMA-Factory、Unsloth等。4、良好的沟通能力和团队合作精神。