岗位职责:1、负责大模型(如Transformer、BERT、GPT等)的研究、开发和优化,包括模型架构设计、训练与微调。2、掌握模型压缩与加速技术(如量化、剪枝、知识蒸馏),提升模型推理效率。3、熟悉有监督微调(SFT)技术,并能够将其应用于实际项目中。4、 研究并实现检索增强生成(RAG)技术,结合外部知识库提升生成效果。5、将大模型技术应用到实际业务场景中,解决实际问题并推动产品化落地。6、 有大模型的部署和优化经验,能够完成从数据预处理到模型训练和评估的全流程。7、 跟踪AI领域的最新研究成果,并将其应用到实际项目中。任职要求:1、计算机科学、人工智能或相关领域的本科及以上学历,硕士学历优先;2、至少3年相关工作经验,有大型语言模型开发经验者优先;3、扎实的机器学习和深度学习基础,熟悉Transformer、BERT、GPT等大模型架构。4、熟悉大模型的训练与微调技术,有监督微调(SFT)的实际项目经验。5、熟悉检索增强生成(RAG)技术,了解如何结合外部知识库提升生成效果。6、熟悉将大模型技术应用到实际业务场景中,解决实际问题并推动产品化落地。7、熟悉Docker python 具备完整的工程能力 。8、良好的沟通能力和团队合作精神,能够与跨职能团队紧密合作。加分项:熟悉分布式训练、模型压缩与加速技术(如量化、剪枝等)。有多模态大模型(文本+图像/音频)相关经验。有发表过相关领域的论文或参与过开源项目。