职位详情1.参与基础大语言模型应用的框架与流程开发,包括:1)探索高阶智能助手技术管线,构建全面、通用和灵活的整体框架,打造用户体验。2)推动智能体在软件领域落地,探索多智能体协作框架,搭建多智能体应用平台。3)针对特定语料,优化向量检索和重排模型。2.参与大语言模型应用的全流程工作,包括数据制备、训练、评测、部署,保证数据和模型的高质量和有效性。3.参与提升大语言模型各方面能力,包括行业知识融合、指令跟随、函数调用、多轮对话、逻辑推理(以解决数学和编程为代表的多步骤复杂推理任务为目标)4.负责特定垂类模型的开发。5.协助模型的部署和交付。6.跟踪前沿大语言模型技术发展,推动创新型应用,确保技术前瞻性。任职要求:1.具备软件开发能力,可以实现产品demo,完成初期想法验证。2.具备出色的工程能力,有能够从零构建复杂框架和系统的结构化思维和代码能力。3.擅长提示词工程,熟悉智能体特性,了解LangChain、MetaGPT、BabyAGI等框架。4.熟悉 RAG 的工作原理,在智能问答或智能搜索的领域实践过 RAG 系统,掌握 Milvus、Qdrant、Pinecone等一个或多个向量数据库。5.具有向量(embedding)模型和重排(reranking)模型的训练经验。6.有大模型应用和部署开发的相关经验,熟悉Dify、0llama、vLLM、Xinference等框架。7.有大模型训练经验,实践过SFT、DPO、RLHF等训练方法,对数据特征、配比和分布有独到的见解。8.具有 Docker 和 Kubernetes 部署经验是加分项。9.参与过国产GPU适配工作是加分项。10.有实施大规模本地推理部署的经历是加分项。11.有从零构建大模型应用和部署框架的经历是加分项