职位描述 我们正在寻找一位精通人工智能、强化学习(RL)与控制理论的工程师,负责设计、实现和优化智能决策与控制系统。如果您同时具备大模型训练经验,我们将优先考虑!您将参与以下工作: 1、研发基于强化学习的智能控制算法,解决工业自动化、机器人等领域的实际问题。 2、结合经典控制理论(如PID、最优控制、模型预测控制)与AI方法,提升系统性能与鲁棒性。 (加分项)参与大语言模型(LLM)或多模态大模型的训练、微调及应用,探索AI与控制的结合点。 3、搭建仿真环境,设计实验并分析数据,推动算法落地到真实场景。 4、跟踪前沿技术(如Meta-RL、多智能体强化学习、模仿学习等),持续优化技术方案。 任职要求 必需技能: 1、硕士及以上学历(或本科3年+经验),计算机、自动化、电子工程、数学等相关专业。 2、熟练掌握强化学习算法(如DQN、PPO、SAC等)及经典控制理论(状态空间、频域分析等)。 3、熟练使用Python,熟悉PyTorch/TensorFlow等深度学习框架,有RLlib、Stable Baselines等工具经验更佳。 4、具备扎实的数学基础(概率统计、优化理论、线性代数)。 5、良好的代码能力和工程落地经验,能独立完成算法开发到部署的全流程。 优先条件: 1、熟悉大模型(LLM)训练流程,包括数据预处理、分布式训练、RLHF等。 2、有机器人运动控制、自动驾驶决策等项目经验。 3、发表过相关顶会论文(ICRA、NeurIPS、ICML等)或开源项目贡献者。