岗位职责:1. 充分理解场景与业务问题,设计和优化实用的强化学习算法与模型;2. 优化并改进神经网络结构;对智能体进行复杂训练,不断提升决策智能体能力;3. 基于海量数据和真实业务需求,建立各种调度和决策模型,辅助决策并优化效率。任职要求:1. 运筹学、统计学、计算机、人工智能、大数据、数学物理等相关专业硕士或博士;2. 对机器学习、深度学习、强化学习有较深入理解;具有良好的代码风格和软件工程思维,良好的分析和解决问题的能力;3. 具有自主改进强化学习、多智能体强化学习的经历;4. 编程基础扎实,熟练适用python/C++语言及tensorflow/pytorth等编程框架;5. 具有大模型研发实际工作背景从优录取。