工作职责:1.负责大模型技术研究和应用,包括RAG、Long Context、多模态相关技术研究:2.负责大模型数据训练方案设计,包括语料建设、指令微调、推理优化;3.负责基于RAG的大模型系统建设, 运用知识库、向量库和知识图谱等技术建设基于大模型服务系统以相关项目实施;任职要求:1.硕士及以上学历,计算机科学、软件工程、数学、自动化、人工智能等相关专业;2.扎实的机器学习、深度学习基础知识,了解主流大模型结构如 GPT、Gemini、Claude、文心一言、通义千问大模型等的原理,包括百川、智谱、kimi、llama等大模型;3、熟悉 Python 编程,熟练掌握 Tensorflow、PyTorch 等主流深度学习架构的其中一种,具有大模型训练微调的实际经验,熟悉lora、sft、freeze、dpo等微调技术;4.熟悉常用RAG框架,比如langchain,RAGflow等框架,能够熟练运用知识图谱、向量库进行数据加工;5.自我激励、自我驱动、踏实肯干、动手能力强、认真负责,喜欢迎接新挑战。