工作职责1、负责基于大模型(如 Qwen、LLaMA、LLAVA 等)的应用开发与优化,包括模型微调、性能优化以及在特定任务中的应用。2 、利用 Prompt 工程技术优化模型的输出和交互效果,设计高效的 Prompt 模板以提升模型的任务执行能力。 3 、使用 LangChain API 开发和集成大模型应用,构建复杂的多步骤任务和流水线,以实现更智能的应用功能。 4 、实施大规模分布式训练,优化计算资源的使用,确保大模型的高效训练和推理。 5 、应用模型压缩、蒸馏、剪枝等技术,提高模型的推理速度和资源效率,确保在生产环境中的高效部署。 6 、与团队紧密合作,推动大模型的创新应用,并解决与大模型开发相关的技术挑战。 7 、持续跟进大模型及其相关技术的发展,主动学习并应用前沿技术,以提升项目的创新性和竞争力。任职资格1 、计算机科学、人工智能、数学等相关专业硕士及以上学历,具备深厚的机器学习和深度学习理论基础。 2 、具备3年以上大模型开发经验,特别是有使用 Qwen、LLaMA、LLAVA 等大模型的实战经验。 3 、熟悉 Prompt 工程技术,能够通过设计和优化 Prompts 来提升大模型的任务执行效果。 4 、掌握 LangChain API 的使用,能够通过其构建和集成复杂的大模型应用。 5 、具备优秀的编程能力,熟练掌握 Python,了解高性能计算技术(如 CUDA、分布式计算框架)。 6 、具备良好的团队合作和沟通能力,能够在跨部门和国际化团队中高效协作。 7 、英语能力较强,能够阅读和理解英文技术文档和研究论文,并能与国际团队进行有效沟通。