岗位职责:1、引领团队开展开源大模型应用落地探索与开发,尤其是与公司相关业务结合的应用落地;2、参与对业务数据进行清洗、分类、分析、存储,完成业务数据集建设;3、参与业务知识库、大模型文本生成、智能问答、知识图谱等应用构建;4、负责对模型进行微调与优化,包括主流大模型Qwen、DeepSeek等;使用Dify、Langchain、Ollama等AI开发工具,运用LORA等技术优化模型性能;5、关注大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。参与对业务数据进行挖掘,完成大模型训练数据集的建设等。岗位要求:1、硕士研究生学历,计算机、人工智能、数学、自然语言处理等相关专业优先;2、在自然语言处理、机器学习相关算法有一定理论功底或学习热情,有AI产品或NLP应用开发经验者优先;3、掌握PyTorch、TensorFlow等机器学习框架,熟悉常见的深度学习模型及其应用方法;4、理解大模型相关的训练和推理技术者优先,包括多机多卡、全参微调、加速、蒸馏、高质量数据构建等;5、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek等)工作原理及应用,熟悉Dify、Langchain、Ollama等一种或多种主流开源LLM/Agent应用开发框架,有实际大模型调优/应用经验者(Prompt tuning、prefix tuning、LORA等一种即可)优先;6、能轻松阅读和理解相关英文技术文档;7、强学习能力、热爱AIGC技术,良好的沟通能力,良好的团队合作精神。