工作职责:1. 模型部署:负责将算法模型有效安装和部署到高通NPU平台,确保其在目标硬件环境中的准确运行。2. 性能优化:进行深入的性能分析,识别与解决模型在NPU推理过程中的性能瓶颈,通过量化、压缩及其他优化手段,提升模型推理速度和计算效率。3. 异常处理:针对推理过程中可能遇到的异常情况,设计相应的处理机制,确保整个推理在不稳定条件下的高可用性。4. 质量监控:在量产阶段实施严格的质量控制,确保产品上线后无质量问题。包括组织和执行测试,以验证部署后的模型在实际应用中的稳定性和可靠性。5. 团队协作:与上下游团队紧密合作,提供技术支持与反馈,共同推动项目的进展。任职资格:1. 计算机科学、电子工程、人工智能或相关专业本科及以上学历。2. 具备2年以上在深度学习、机器学习或AI算法加速相关领域的工作经验,有高通NPU平台部署经验者优先。3. 熟悉python、c++和pytorch,理解模型量化、压缩和优化的相关技术,具有性能分析和调优的实践经验。4. 具备较强的分析与解决问题能力,能够应对推理过程中的各种异常情况,并设计相应的解决方案。5. 良好的团队合作精神与沟通能力,能够有效与跨职能团队合作,推动项目的顺利进行。