岗位职责:1、参与多模态大模型多体裁内容数据链路建设、指令微调、偏好对齐、模型优化全流程实践;2、探索并落地超大规模多模态大模型,做端大模型轻量化,并结合应用场景在目标平台上做推理优化;3、跟踪调研多模态大模型以及相关方向(包括但不限于CV/NLP/多模态/Agent)的前沿技术。任职要求:1、硕士/博士研究生学历,计算机/人工智能等专业,有大模型工作经验优先;2、深入了解人工智能技术理论以及底层算法,有很强的数学基础,精通各类深度学习网络,如卷积神经网络(CNN)、循环神经网络(RNN)、Transformer、Diffusion等;3、熟悉大模型的训练和优化方法,如分布式训练、混合精度训练、梯度累积以及各种调优方法;熟悉业界知名的开源大模型的原理、代码,熟悉训练和推理方法;4、具备良好的英语文献阅读理解能力,具备强烈的责任心、进取心、良好的沟通能力及团队合作精神。