职责描述: 1. 负责LLM模型的微调训练,优化训练过程和最终指标,解决过程中遇到的算法工程问题。 2. 优化模型推理性能,分析性能瓶颈,提出改进方案。 3. 开展算子开发,能够根据算力设备或者性能需求进行自定义算子的设计与实现。 4. 针对不同的算力设备(主要是国产算力卡),进行模型的适配和优化工作,提升模型在各类硬件上的运行效率。 5. 与算法和产品团队紧密合作,将优化成果转化为实际应用,为公司产品提供可靠的算法支持。岗位要求:岗位要求: 1. 计算机、软件工程、人工智能等相关专业本科及以上学历。 2. 具备扎实的数据结构与算法功底,熟练掌握Python或C/C++编程技巧,熟悉机器学习与深度学习的基本原理和常用算法。 3. 熟练使用常见的模型训练框架(如TensorFlow、PyTorch等),确保模型的高效训练和高质量结果。 4. 熟悉常见的模型推理框架(如Vllm、TensorRT、ONNX Runtime等),并具备性能优化的实际经验。 5. 熟练掌握CUDA编程模型和GPU加速技术等,有基于国产化芯片(如华为晟腾、寒武纪等)的深度学习框架开发和优化经验优先。 6. 有较强的分析和解决问题的能力,具备较好的团队协作和沟通能力。加分项: 1. 在国产AI芯片、LLM领域有相关经验者。 2. 具有跨平台模型部署经验。 3. 有完整的LLM从模型训练到应用的落地经验。