岗位职责:1. 负责大语言模型(LLM)的技术演进与产业落地,主导RAG(检索增强生成)系统的架构设计、搭建与持续优化;2. 基于业务场景设计模型微调方案,运用LoRA/QLoRA/P-Tuning等参数高效微调技术进行领域适配;3. 使用深度学习开展目标识别、数据挖掘等应用;4. 构建多模态知识库检索系统,优化embedding模型与向量数据库的协同工作机制;5. 负责深度学习工程环境的搭建与部署,包括硬件资源配置、软件环境安装、依赖库管理等。任职要求:1. 计算机/数学/人工智能等相关专业,985/211或QS前200高校硕士及以上学历;2. 具备较好的编程能力,熟练掌握Python编程语言;3. 具备RAG全链路开发能力,熟悉LangChain/LlamaIndex等工具及Milvus/Pinecone等向量数据库;4. 精通模型微调技术栈,有LoRA/Adapter/Prompt Tuning等参数高效微调实战经验;5. 熟悉TensorFlow、Caffe、MXNet等主流深度学习框架中的一种或多种;6. 具备云原生部署经验,熟悉Kubernetes、Docker及主流云平台AI服务(AWS SageMaker等)。