职位详情

登录

机器学习平台开发工程师
1.5-3万
若干 · 本科 · 在校生/应届生 · 性别不限2025/02/22发布

天府软件园

公司信息
摩尔线程智能科技(成都)有限责任公司

民营

该公司所有职位
职位描述
岗位职责:
欢迎加入摩尔线程KuaE SW组,我们专注于大模型在 KuaE GPU 集群的分布式训练稳定性及可观测性,通过构建领先的分布式训练体系,支持万卡规模大模型训练,为国产大模型的发展助力。加入我们,一起探索技术的无限可能!
1. 大规模分布式训练稳定性策略开发及调试。
2. 大规模分布式训练可观测体系的开发及优化。
3. 大模型训练的接入及开发。
4. 提供远程或现场的技术支持,解决客户在进行大规模分布式训练中遇到的技术问题。
5. 编写和维护技术文档,包括故障排除指南、用户手册和***实践。
6.调研业界最新的分布式训练技术及方案。
7. 深度参与研发产品特性开发,为研发产品支持新特性。

任职要求:
1、 计算机科学、电子工程或相关领域的本科及以上学历。
2、良好的逻辑思维能力,精通计算机数据结构和算法;
3、熟悉至少一种编程语言,如GoLang、Python等。
4、熟悉云原生体系,对 Kubernetes,Docker ,Containerd 有一定的了解及使用经验。
5、 熟悉大模型训练,对当前最新大模型如Llama、Qwen、ChatGLM 等有一定的了解,***是做过大模型相关的训练。
6、 至少有一种机器学习框架使用或者开发经验,如PyTorch、Megatron-LM、DeepSpeed、PaddlePadde、Colossal-AI 等。
7、 对大规模分布式训练技术感兴趣,期待做有挑战性的事情;有 owner 意识,具备团队合作的能力。

相关职位
大模型开发工程师1.5-2.5万
节假日福利
深度学习框架开发工程师1.5-3万
软件开发工程师(成都)1.5-3万
机器学习/AI算法工程师22-27万/年
人工智能应用场景研发工程师1.1-2万
查看所有职位
51米多多提醒你:在招聘、录用期间要求你支付费用的行为都必须提高警惕。 以招聘为名的培训、招生,许诺推荐其他工作机会,甚至提供培训贷款,或者支付体检 、服装、押金和培训等费用后才能录用工作的,都属于违法行为,应当提高警惕。一经发现,请立即举报,并向当地公安机关报案。

举报

招聘信息 > 成都招聘 > 管培生招聘 > 成都管理培训生招聘

收藏

热门职位热门城市周边城市