岗位职责1、负责神经网络模型的轻量化技术研究与应用(包括但不限于量化、剪枝、知识蒸馏、网络结构搜索等),提升模型在资源受限设备上的运行效率2、针对业务需求设计并实现高效的模型压缩算法,平衡模型精度、计算量、内存占用等指标3、与硬件团队协作,针对芯片特性(如缓存、内存带宽、并行计算单元)设计高效推理方案4、输出标准化部署工具链或自动化流程,提升团队效率。岗位要求1、计算机科学、电子工程、自动化、人工智能相关专业硕士及以上学历,3年以上算法工程化经验2、熟练掌握PyTorch或TensorFlow等框架,深入理解模型压缩技术原理(如量化校准、稀疏训练、通道剪枝)3、具备嵌入式或安卓或IOS开发经验,熟悉C/C++、交叉编译工具链,能独立完成常见的单片机/NPU或IOS、安卓上的模型部署与调试。4、熟悉常见端侧推理框架(如TFLite、ONNX Runtime、TVM、SNPE)及模型格式转换工具(如NNEF、OpenVINO)加分项1、有过至少1个完整端侧模型部署项目(如CV/NLP模型在STM32/NPU芯片的落地、安卓、IOS机等),熟悉模型从训练到部署的全链路问题2、有MCU(如STM32、ESP32)或边缘芯片(如瑞芯微、地平线、Hailo)部署经验,熟悉其SDK及硬件加速库。3、熟悉编译原理,了解MLIR/LLVM或自动代码生成工具(如Halide、AutoKernel)。4、熟悉芯片底层优化技术(如ARM NEON指令集、NPU指令调度、内存对齐优化),有性能分析工具(如Perf、Trace32)使用经验