工作职责:1、能够根据客户实际业务场景选择合适模式(standard/lite/devserver),支撑客户业务;2、具备迁移方案规划与实施能力,能够针对特定框架的模型从GPU迁移到NPU,尤其是对昇腾云已适配列表中的模型迁移,能依据华为官方主流开源大模型软件包,完成Devserver/Standard的训练、推理迁移适配工作;3、具备精度与性能调优能力,在推理与训练场景下,能够通过专业工具采集精度数据并分析,判断模型是否存在精度问题;4、能够通过专业工具采集精度数据并分析,判断模型是否存在精度问题;能够精准定位精度误差根因(如算子输出结果溢出、累计误差、模型转换引入偏差等),并运用多种方法进行精度调优,满足客户验收标准精度要求;5、通过Benchmark等工具采集性能数据,分析性能瓶颈,运用自动化性能调优工具及高阶性能调优方法优化性能,达到客户验收标准性能要求,并能测算性能优化效果及实际收益。任职资格:1、能够根据客户实际业务场景选择合适模式(standard/lite/devserver),支撑客户业务;2、具备迁移方案规划与实施能力,能够针对特定框架的模型从GPU迁移到NPU,尤其是对昇腾云已适配列表中的模型迁移,能依据华为官方主流开源大模型软件包,完成Devserver/Standard的训练、推理迁移适配工作;3、具备精度与性能调优能力,在推理与训练场景下,能够通过专业工具采集精度数据并分析,判断模型是否存在精度问题;4、能够通过专业工具采集精度数据并分析,判断模型是否存在精度问题;能够精准定位精度误差根因(如算子输出结果溢出、累计误差、模型转换引入偏差等),并运用多种方法进行精度调优,满足客户验收标准精度要求;5、通过Benchmark等工具采集性能数据,分析性能瓶颈,运用自动化性能调优工具及高阶性能调优方法优化性能,达到客户验收标准性能要求,并能测算性能优化效果及实际收益。