岗位职责:1.算法研发与优化1)负责机器人路径规划、运动控制、多任务决策等场景的强化学习/深度强化学习算法设计与实现,包括但不限于PPO、DDP G、A3C、模仿学习等算法。2)研究多模态信息(视觉、触觉、力控等)与强化学习的融合技术,提升机器人复杂环境下的自主决策能力。2.仿真环境搭建与训练构建高精度机器人仿真训练环境(如Isaac Gym、Mujoco、V-REP等),实现算法从仿真到实体机器人的迁移部署(Sim2Re al).3.算法工程化与验证1)与机器人硬件、机器视觉团队协作,完成算法在真实机器人系统中的调试与性能优化,解决实际场景中的动力学约束、噪声干扰等问题。2)分析实验数据,持续改进算法效率、鲁棒性和泛化能力。4.前沿技术探索跟踪强化学习领域最新研究(如分层强化学习、元学习、多智能体协作等),推动创新技术在机器人领域的落地。任职要求:1.基础要求:1)本科及以上学历,计算机科学、人工智能、机器人学、控制工程等相关专业。2) 熟练掌握Python/C++编程,熟悉PyTorch/TensorFlow框架,具备扎实的数学基础(线性代数、概率论、优化算法)。2.核心技能1)深入理解主流强化学习算法(DQN、PPO、SAC等)及机器人运动学/动力学建模方法。2) 熟悉ROS机器人操作系统及至少一种仿真工具(如Gazebo、lsaac Sim).3.项目经验:1)有机器人强化学习算法研发经验(如机械臂操作、足式机器人运动控制、自动驾驶决策等),熟悉算法部署全流程优先。2)在机器人顶会(ICRA、IROS、CoRL)或AI顶会(NeurlPS、ICML)发表论文者优先。