职位描述:1、负责探索大模型技术在汽车行业领域中的应用,包括但不限于场景识别,对话生成,多模态理解等方面工作;2、与产研同学合作,深入理解业务,协作完成相关产品方案的研发,包括数据获取,模型训练、评测、精调,效果评估及部署优化等,支持行业内应用落地;3、深入跟踪调研LLM/多模态/NLP/CV等方向的前沿技术。职位要求:1、具备计算机科学、软件工程、人工智能、数学、统计学等相关专业的学士及以上学历,拥有扎实的理论基础和丰富的实践经验,以高效地完成工作;2、熟练掌握Python、C++等编程语言,有扎实的编程基础、良好的编码风格,能够熟练运用各种编程技巧和算法。熟悉DeepSpeed或Megatron-LM并行训练框架,以及CUDA的使用开发经验,有良好的工程能力,能够独立负责模型的端侧部署优化,以提高整个系统的效率和性能;3、熟悉机器学习、深度学习、数据挖掘等算法和技术,熟悉NLP、视觉-语言多模态大模型预训练技术,高效微调训练(SFT/向量召回/RLHF/Prompt优化/RAG应用等)和模型量化加速,部署优化,能够独立负责数据准备,模型训练,效果评估,部署优化等闭环流程;4、具有良好的团队协作和沟通能力,积极乐观,责任感强,能够与团队成员密切合作,共同完成项目任务。