工作职责:1、理解NPU的需求Spec,设计和定义NPU子系统的微架构设计;2、分析现有的NPU架构的bottleneck,并给出提升的可行方案;3、评估现有的NPU架构,并进行优化以提高performance/power/area4、跨部门 (Algorithm/RTL/DV/SW/ML Applications)合作,以达到NPU设计的最优任职资格:1.有相关 NPU, GPU, 和 微处理器核开发经验,特别是multi-core系统。2.有 ML networks 和 ML frameworks (Tensorflow, PyTorch, TVM, 等)经验3.对NPU micro-architecture, RTL, synthesis, verification, and Neural Network Compilers比较熟悉4.熟悉硬件描述语言– Verilog/SystemVerilog,了解设计和验证流程;5.接触过Cuda/OpenCL 或其他并行编程语言6.具有操作系统基础知识7.熟悉芯片工艺, 存储, 片上互联系统等