岗位职责:1、负责研发和优化大模型推理优化和部署技术,如模型优化、压缩、量化、推理加速等, 提升模型效率和性能;2、基于公司dNPU平台,根据实际需求引入业界先进的算法,对大模型算法进行改进和创新; 3、跟踪并应用大模型领域的最新研究成果,完成在公司平台的适配和部署;4、参与公司新处理器的芯片架构研发。任职要求:1、硕士及以上学历,在自然语言处理、计算机视觉、计算数学等领域有较深入的研究;2、有科研经验、在NeurIPS、CVPR、ICCV、ECCV、ICLR、ICML等国际顶刊、顶会上发表过论文者优先3、扎实的数学和算法基础:概率统计、数值优化算法,凸优化算法,矩阵论等有深刻理解;4、可以处理大规模数据,利用PyTorch、TensorFlow等框架搭建神经网络,并进行大规模训练;5、熟悉python和C++,熟悉基础数据结构和算法;6、拥有快速学习新技术的能力,能够在较短时间内理解前沿论文,有独立思考的能力;7、能与团队融洽合作相处,积极主动有热情。