工作职责:1、负责大模型前沿算法研发和训练任务,包括大规模数据集构建,prompt工程,大模型框架设计搭建,大模型训练微调和推理优化,多机多卡并行训练,支撑大模型下游任务调优;2、负责前沿算法研究/研发工作,包括但不限于语言大模型/多模态大模型/复杂系统建模/时空数据挖掘/时序预测和异常检测/智能优化控制/智能决策/结构化数据建模分析等;3、跟进机器学习/深度学习领域前沿技术,关注语言大模型技术、多模态大模型技术、时空数据建模、强化学习、图网络、优化决策、元学习、模型可解释性、知识图谱构建、基础模型理论研究、空间智能等,负责公司AI技术的前瞻性研究和应用场景落地,并输出论文;4、支撑中国移动和合作企业各类业务和运营场景,对智能交通、智慧工业、智能金融营销、智能物流调度等场景进行建模,完成智能化应用相关算法研发和迭代调优工作。任职要求:1、有机器学习、深度学习、自然语言处理、结构化数据分析、视觉等相关学习经验,对大模型训练和微调、多模态通用表征、时空数据挖掘、时序预测和异常检测、图学习、智能体等相关领域有实践经验者优先;2、熟练使用Python,熟悉Linux开发环境和shell,熟悉主流深度学习工具TensorFlow/Caffe/MXNet/等,有大数据开发经验、熟悉大规模数据处理平台Hadoop/Spark者优先;3、熟悉常用数据结构和算法,熟悉机器学习或深度学习常用算法模型并有丰富的实践经验,包括但不限于:XGB、CNN、LSTM、强化学习、图网络(GNN/GCN/GAT)等;4、具备很强的自我驱动与结果导向意识,具备创新能力,具备团队协作意识和能力;5、扎实的算法基础,熟悉Transformer/GPT等模型结构,了解大模型的微调和评估方法;6、熟悉大模型前沿算法,并有丰富的研发实践经验者优先;7、在AI领域***会议/期刊有论文发表者优先。