1.算法研发与优化1)负责机器人路径规划、运动控制、多任务决策等场景的强化学习/深度强化学习算法设计与实现,包括但不限于 PPO、DDP G、A3C、模仿学习等算法。2)研究多模态信息(视觉、触觉、力控等)与强化学习的融合技术,提升机器人复杂环境下的自主决策能力。2.仿真环境搭建与训练构建高精度机器人仿真训练环境(如 Isaac Gym、Mujoco、V-REP 等),实现算法从仿真到实体机器人的迁移部署(Sim2Real).3.算法工程化与验证1)与机器人硬件、机器视觉团队协作,完成算法在真实机器人系统中的调试与性能优化,解决实际场景中的动力学约束、噪声干扰等问题。2)分析实验数据,持续改进算法效率、鲁棒性和泛化能力。4.前沿技术探索跟踪强化学习领域最新研究(如分层强化学习、元学习、多智能体协作等),推动创新技术在机器人领域的落地。任职要求:1.基础要求:1)本科及以上学历,计算机科学、人工智能、机器人学、控制工程等相关专业。2)熟练掌握 Python/C++编程,熟悉 PyTorch/TensorFlow 框架,具备扎实的数学基础(线性代数、概率论、优化算法)。2.核心技能1)深入理解主流强化学习算法(DQN、PPO、SAC 等)及机器人运动学/动力学建模方法。2)熟悉 ROS 机器人操作系统及至少一种仿真工具(如 Gazebo、lsaac Sim).3)了解图形处理基本算法,如 SIFT、HOG、SURF 等;了解深度学习视觉算法,包括但不限于 YOLO 系列、Mask R - CNN、U - Net、Transformer - based 视觉模型等3.项目经验:1)有机器人强化学习算法研发经验(如机械臂操作、足式机器人运动控制、自动驾驶决策等),熟悉算法部署全流程优先。2)有使用SDK开发机器人,完成执行任务的经验。3)对卷积神经网络(CNN)架构有深刻理解,具备一定的模型设计与调优经验,能根据不同视觉任务特点,灵活运用 CNN 进行图像识别、目标检测、图像分割等模型的搭建、优化与部署,且参与有成功项目落地案例4)在机器人顶会(ICRA、IROS、CoRL)或 AI 顶会(NeurlPS、ICML)发表论文者优先。