职位详情

登录

算法工程师(强化学习方向)
2-3.5万·14薪
人 · 硕士 · 在校生/应届生 · 性别不限2024/10/30发布
五险一金免费班车餐饮补贴交通补贴绩效奖金年终奖金股票期权弹性工作定期体检

中控科技园

公司信息
中控技术股份有限公司

已上市/5000-10000人

该公司所有职位
职位描述
岗位职责:
1. 强化学习算法设计与开发:负责设计、优化和实现强化学习算法,包括模型自由策略、值函数逼近、策略优化等。
2. 模型训练与评估:实施强化学习模型的训练、调参与评估,分析模型表现,调整策略以达到最优性能。
3. 实际应用研究:将强化学习技术应用到实际业务问题中,开发创新的工程解决方案。
4. 技术研究和创新:跟踪国内外强化学习领域的最新研究成果,探索并引入先进的算法和技术,以提升现有解决方案的性能和效果。
5. 数据处理与仿真环境:负责构建和维护模拟和仿真环境,进行数据预处理,并生成训练数据,设计合理的奖励机制。
6. 跨部门协作:同产品、数据工程、业务等多个部门紧密配合,理解业务需求并提出相应的强化学习解决方案。
7. 文档撰写与知识分享:编写算法文档和技术报告,进行成果展示和知识分享,帮助团队成员理解强化学习算法及其应用场景。
8. 模型部署与维护:协助将强化学习模型部署到生产环境中,并监控和维护模型性能,进行必要的更新和优化。
岗位要求:
1. 教育背景:计算机科学、电子工程、数学、控制理论或相关专业硕士及以上学历,博士优先。
2. 编程能力:熟练掌握Python或其他编程语言(如C++、Java),具备实现强化学习算法的能力;了解常见的机器学习和数据处理库(如TensorFlow、PyTorch、Pandas、NumPy等)。
3. 强化学习基础:具备扎实的强化学习理论知识,熟悉Q-learning、深度Q-network (DQN)、策略梯度方法(如REINFORCE、PPO、A3C)等经典算法。
4. 数值优化与仿真建模:具有良好的数值优化基础和算法实现能力,能够构建和使用仿真环境进行算法测试。
5. 数据分析能力:具备良好的数据分析与处理能力,能够从数据中提取有效信息,并使用这些信息优化算法。
6. 科研与创新能力:具备较强的科研能力和创新思维,能够分析并解决在项目实施过程中出现的复杂问题。
7. 团队合作与沟通能力:有良好的团队合作精神和沟通能力,能够与跨职能团队有效协作,共同推进项目进展。
8. 学习与适应能力:对强化学习和新技术充满兴趣,能够快速学习和适应新知识、新环境。
9. 附加加分项:有在强化学习领域的实际项目经验,发表过相关领域论文或在开源项目中有贡献者优先考虑。

51米多多提醒你:在招聘、录用期间要求你支付费用的行为都必须提高警惕。 以招聘为名的培训、招生,许诺推荐其他工作机会,甚至提供培训贷款,或者支付体检 、服装、押金和培训等费用后才能录用工作的,都属于违法行为,应当提高警惕。一经发现,请立即举报,并向当地公安机关报案。

举报

招聘信息 > 杭州招聘 > 人工智能招聘 > 杭州算法工程师招聘

收藏

热门职位热门城市周边城市