工作职责1、研究开发多模态模型模型应用的训练/推理/部署方案,产出原型系统;2、跟进前沿大模型训练、推理、部署、加速优化等技术,保持技术优势;3、解决大模型的可控可信度不足、推理效率低的问题,解决大模型应用落地的技术障碍。任职资格1、硕士研究生及以上学历,计算机、电子信息等相关专业,2年及以上算法工程化开发经验;2、精通python语言开发,熟悉NumPy,Pandas,Matplotlib,scikit-learn,Keras常用库;3、具备大模型的实际应用经验,如GPT系列、BERT、T5等模型的开发和优化,对大模型的训练、评估、优化以及微调具备实际落地经验;4、熟练掌握Pytorch,Tensorflow、PaddlePaddle等至少一种深度学习框架;5、熟悉大模型分布式训练技术和加速库,如Megatron、DeepSpeed、PaddleFleetX等;6、了解大模型在产品化过程中的调优、量化、封装、部署、调度、并发、时延等常见软硬件问题;7、了解模型压缩技术,如量化、剪枝、稀疏、蒸馏等;8、加分项:有在权威会议或期刊发表过人工智能领域论文的经历;有参与申报国拨项目、国家省部级奖项等材料撰写或汇报的经历;了解量子计算、量子人工智能优先。