岗位职责:1、协助完成具身智能机器人的强化学习控制训练和算法调优;2、算法部署,和PD标定,协助排查通信延时等异常;3、sim2real验证,根据实机效果调整仿真gap。岗位要求:1、熟悉传统控制(MPC和LQR等)或者强化学习(PPO等);2、熟悉legged gym框架,有isaac和mujoco仿真经验优先;3、有act或diffusion policy相关经验的优先;4、研究生以上学历。