【职位详情】参与基础大语言模型应用的框架与流程开发,包括探索高阶智能助手技术管线,通用和灵活的整体框架推动智能体在软件领域落地,探索多智能体协作框架,搭建多智能体应用平台;针对特定语料,优化向量检索和重排模型。参与大语言模型应用的全流程工作,包括数据制备、训练、评测、部署,保证数据和模型的高质量和有效性。参与提升大语言模型各方面能力,包括行业知识融合、指令跟随、函数调用、多轮对话、逻辑推理(以解决数学和编程为代表的多步骤复杂推理任务为目标)。负责特定垂类模型的开发。协助模型的部署和交付。跟踪前沿大语言模型技术发展,推动创新型应用,确保技术【任职要求】具备软件开发能力,可以实现产品demo,完成初期想法验证。具备出色的工程能力,有能够从零构建复杂框架和系统的结构化思维和代码能力。擅长提示词工程,熟悉智能体特性,了解LangChain、MetaGPT、BabyAGI 等框架。熟悉 RAG 的工作原理,在智能问答或智能搜索的领域实践过 RAG 系统,掌握 Milvus、Qdrant、Pinecone等一个或多个向量数据库。具有向量(embedding)模型和重排(reranking)模型的训练经验。有大模型应用和部署开发的相关经验,熟悉Dify、Ollama、vLLM、Xinference等框架。有大模型训练经验,实践过SFT、DPO、RLHF等训练方法,对数据特征、配比和分布有独到的见解。具有 Docker 和 Kubernetes 部署经验是加分项。参与过国产 GPU适配工作是加分项。有实施大规模本地推理部署的经历是加分项。有从零构建大模型应用和部署框架的经历是加分项,