【上海强化学习工程师G11677职位招聘_上海外服（集团）有限公司招工招聘信息】-51米多多招聘网

职位详情

强化学习工程师G11677

2-4万·14薪

人 · 本科 · 3-5年工作经验 · 性别不限2025/05/14发布

上海

低价好房出租>>

智创TOP产城综合体-A区

公司信息

上海外服（集团）有限公司

国企/1000-5000人

该公司所有职位

职位描述

岗位职责
我们正在寻找一名强化学习工程师。您将负责为我们的人形机器人开发、训练和部署新的强化学习算法，以及构建支持大规模训练策略的基础设施。
1、为运动和操控任务开发、训练和部署强化学习算法
2. 构建模拟基础设施，以支持大规模通用人形机器人的运动和操控策略训练
3. 与控制团队合作，将策略集成到现有的控制堆栈中
4. 定义、测试和评估学习策略的性能指标
岗位要求
1.熟练的在 PyTorch 中编写生产质量代码
2.熟悉在线和离线强化学习算法：PPO、SAC 等。
3.具有为这些 RL 算法调整超参数和成本函数的经验
4.熟悉常见的 RL 技术，例如：领域随机化、课程学习、奖励塑造等。
5.熟悉通用 ML 评估工具，例如 TensorBoard、Weights&Biases 等。

打开App查看详情

相关职位

机器学习算法工程师2.5-4万·15薪

机器学习算法工程师2-4万

机器学习-model Relocate2.2-3万·14薪

AIGC/AIDD/CADD算法工程师 (MJ006878)2-4万·14薪

大数据与人工智能2-4万

查看所有职位

51米多多提醒你：在招聘、录用期间要求你支付费用的行为都必须提高警惕。以招聘为名的培训、招生，许诺推荐其他工作机会，甚至提供培训贷款，或者支付体检、服装、押金和培训等费用后才能录用工作的，都属于违法行为，应当提高警惕。一经发现，请立即举报，并向当地公安机关报案。

招聘信息 > 上海招聘 > 人工智能招聘 > 上海机器学习工程师招聘

热门职位热门城市周边城市