职位详情

登录

AI推理部署工程师
2.5-3.5万·13薪
人 · 本科 · 无需经验 · 性别不限2024/11/20发布
五险一金年终奖金定期体检餐饮补贴专业培训弹性工作交通补贴带薪年假居家办公

中海国际中心

公司信息
上海哈明科贸有限公司

民营

该公司所有职位
职位描述
岗位职责:
1. 优化大模型训练和推理性能,降低大模型推理时延,提升吞吐,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等;
2. 适应并充分利用硬件资源,控制模型部署成本;
3. 对模型训练和部署时出现的精度与性能问题进行分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度;
4. 推动深度学习优化算法的研发和产业落地。
岗位需求:
1. 本科学历以上,计算机/软件/人工智能相关专业加分;
2. 扎实的C++代码能力,具备深度学习应用加速和优化的经验,能够根据不同场景和硬件平台进行针对性的优化;
3. 熟练掌握TensorFlow、PyTorch等至少一种深度学习框架;
4. 熟悉常见的分布式机器学习框架,如Megatron、DeepSpeed、HuggingFace Transformers等;
5. 具备良好的沟通和团队合作能力,能够与跨团队密切合作,解决问题并实现共同目标。
加分项:
1. 熟悉CUDA Kernel开发,有底层算法性能调试及加速经验;
2. 熟悉LLM主流推理引擎,如FasterTransformer/vLLM;
3. 熟悉常见的推理优化方法,如FlashAtention、PageAttention、Continuous Batching、Speculative Decoding等;
4. 熟悉TensorRT/Triton/Cutlass经验者优先;
5. 有AIGC模型推理和训练加速落地经验者优先;
6. 熟悉分布式推理加速框架,有超大模型分布式加速经验优先。

相关职位
图像算法研究员2-4万
广告算法策略工程师2.5-5万
六险一金团队氛围好晋升空间大
联邦学习算法工程师2-4万
博士后(人工智能算法)2.5-3.5万
五险一金周末双休绩效奖金
编译器开发高级工程师2.5-5万·15薪
查看所有职位
51米多多提醒你:在招聘、录用期间要求你支付费用的行为都必须提高警惕。 以招聘为名的培训、招生,许诺推荐其他工作机会,甚至提供培训贷款,或者支付体检 、服装、押金和培训等费用后才能录用工作的,都属于违法行为,应当提高警惕。一经发现,请立即举报,并向当地公安机关报案。

举报

招聘信息 > 北京招聘 > 人工智能招聘 > 北京深度学习工程师招聘

收藏

热门职位热门城市周边城市