任职资格:1、硕士及以上学历,计算机、人工智能、软件等相关专业,具备3年以上AI领域工作经验2、具备扎实的Python或C/C++开发功底,熟练掌握PyTorch、Tensorflow等主流深度学习框架;3、熟悉SOTA的模型架构和训练方法,如多模态模型、自监督学习、迁移学习、知识蒸馏;4、具备AIGC、对话问答、大模型搭建、多模态模型开发全流程(数据采集清洗、模型设计调优、性能评测诊断)、分布式训练及部署经验者优先;5、具备深度学习方向的开源项目维护、二次开发经历或相关方向高水平论文发表者优先。岗位职责:1、参与公司大模型的训练工作包括不限于预训练、对齐训练等;2、负责大模型的基础网络架构、训练优化算法、效率及稳定性提升、数据集建设等方面持续优化迭代;3、负责优化模型推理性能,包括模型压缩、访问优化、算子优化等;4、负责跟着业内大模型应用的关键技术发展情况,以及探索前沿智能化应用。