岗位职责:大模型架构设计与优化主导千亿参数级大语言模型的架构设计、训练及调优,探索分布式训练、模型压缩、量化等前沿技术开发面向AI芯片架构的模型优化方案,实现低功耗/低精度计算条件下的性能***化芯片适配算法开发针对公司自研芯片特性设计定制化算法,包括算子优化、内存调度、混合精度训练等关键技术构建芯片-算法联合优化体系,开发模型部署SDK及自动化优化工具链行业解决方案开发深入理解AI芯片在云计算、自动驾驶、边缘计算等场景的应用需求设计面向垂直领域的轻量化大模型方案,建立行业标杆案例技术生态建设主导开源框架(PyTorch/TensorFlow)与自研芯片的深度适配构建大模型算法基准测试体系,输出技术白皮书与行业标准前沿技术研究跟踪Diffusion Models、MoE架构、神经拟态计算等前沿方向推动芯片原生的大模型技术创新,主导专利布局与顶会论文发表岗位要求:对大模型的模型算法比较熟悉;对pytorch和各种大模型框架比较熟悉;能够做大模型的推理性能分析和调优。