工作职责:1、搭建仿真平台(例如gazebo或isaac sim);2、自主导航强化学习算法实现及落地;3、跟进领域内前沿技术与优秀论文与开源框架任职资格:1、掌握强化学习基本理论及主流算法例如DQN/PG/AC/PPO等,有强化学习算法用于自主决策及导航的实现经验、仿真平台搭建经验;2、数学功底扎实,快速复现优秀论文网络能力;3、优秀的检索能力与英文论文阅读能力;4、扎实的c/c++/python编程技能及良好的编程规范;5、对导航算法有一定了解