岗位职责:欢迎加入摩尔线程AI framework团队,我们专注于主流深度学习框架以及大模型和传统模型的完整生命周期,我们的使命是为Kuae打造高效的万卡集群训练基础设施与业界领先的基座大模型。加入我们,一起探索技术的无限可能!1. 参与主流机器学习框架(如PyTorch和PaddlePaddle)与摩尔线程软硬件栈的对接,模型训练、推理和部署;2. 参与机器学习单GPU以及分布式训练技术的研究与实现,如各种并行与异构计算技术的设计、开发以及与性能优化;3. 参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。任职要求:1. 熟悉Linux开发环境,精通C++和Python,具备良好扎实的算法基础、良好的编程风格和系统设计能力;2. 深入理解典型的深度学习算法(如CV和NLP模型),主流深度框架(如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等)开发或优化经验;3. 有深度学习编译器(如XLA、TVM、MLIR)等软件栈的开发经验;4. 精通分布式训练技术,有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑;4. 有机器学习模型性能调优和模型压缩(量化、剪枝、蒸馏、NAS等)经验者可优先考虑;5. 精通并行计算通信库(如MPI),有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑;6. 有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。