岗位职责:1、在AI基础平台团队,负责AI模型推理优化加速、推理引擎和部署库的研发,服务于公司核心业务;2、通过算子开发、图优化、混合精度、剪枝、编译优化等手段优化模型性能,适应各硬件平台(CPU/GPU/ARM);3、紧跟业内前沿,持续优化引擎和框架。岗位要求:1、具有扎实的计算机视觉AI算法能力,对图像分类、目标检测、语义分割、视频理解等1个或多个技术方向有较为深入的理解;2、擅长C/C++编程,熟悉Python,熟悉Linux环境下的开发;3、熟悉CMake,makefile等编译工具,熟悉git版本管理工具;4、熟练掌握Pytorch深度学习框架,对深度学习模型有一定了解;5、熟悉图优化、混合精度、模型蒸馏、剪枝、量化、编译优化技术;6、熟悉TensorRT推理加速库,熟悉常用高性能库(cuDNN/cuBLAS)开发和性能优化加分;7、有并行/异构编程经验,有实际的CUDA开发经历、深度学习模型部署、优化及网络结构优化、内存优化经验优先;8、熟悉开源项目Triton、OpenVINO等优先。