【杭州AI算法工程师（强化学习与控制方向）职位招聘_中控技术股份有限公司招工招聘信息】-51米多多招聘网

职位描述
我们正在寻找一位精通人工智能、强化学习（RL）与控制理论的工程师，负责设计、实现和优化智能决策与控制系统。如果您同时具备大模型训练经验，我们将优先考虑！您将参与以下工作：
1、研发基于强化学习的智能控制算法，解决工业自动化、机器人等领域的实际问题。
2、结合经典控制理论（如PID、最优控制、模型预测控制）与AI方法，提升系统性能与鲁棒性。
（加分项）参与大语言模型（LLM）或多模态大模型的训练、微调及应用，探索AI与控制的结合点。
3、搭建仿真环境，设计实验并分析数据，推动算法落地到真实场景。 4、跟踪前沿技术（如Meta-RL、多智能体强化学习、模仿学习等），持续优化技术方案。
任职要求
必需技能：
1、硕士及以上学历（或本科3年+经验），计算机、自动化、电子工程、数学等相关专业。
2、熟练掌握强化学习算法（如DQN、PPO、SAC等）及经典控制理论（状态空间、频域分析等）。
3、熟练使用Python，熟悉PyTorch/TensorFlow等深度学习框架，有RLlib、Stable Baselines等工具经验更佳。
4、具备扎实的数学基础（概率统计、优化理论、线性代数）。
5、良好的代码能力和工程落地经验，能独立完成算法开发到部署的全流程。
优先条件：
1、熟悉大模型（LLM）训练流程，包括数据预处理、分布式训练、RLHF等。
2、有机器人运动控制、自动驾驶决策等项目经验。
3、发表过相关顶会论文（ICRA、NeurIPS、ICML等）或开源项目贡献者。