【重庆高级解决方案工程师（大模型算法）职位招聘_航天时代低空科技有限公司招工招聘信息】-51米多多招聘网

岗位职责：负责开发公司的大模型推理框架，推动大模型相关算法的落地，打造高吞吐、低延时的推理系统。持续优化大模型推理服务框架，提升服务稳定性和框架易用性。持续优化大模型推理服务性能，提升吞吐，降低延迟并优化整体成本。跟进和探索前沿的大模型推理技术，不断追求业务突破。
岗位要求：熟练掌握 C++、Python 语言，熟悉 CPU/GPU 异构系统性能调优，有 AI 工程优化经验的优先。了解主流的 LLM 模型结构，掌握大模型推理相关技术栈，有大模型加速优化经验者优先。熟悉 GPU 高性能计算加速技术，了解常用的 CUDA 优化方法。；有 Tensorrt/FasterTransformer/vLLM/TensorRT-LLM 等深度学习推理框架的实际使用经验；熟悉常见的 LLM 推理优化方案，包括但不限于 Batching、分布式推理、模型压缩（量化、稀疏化）、投机采样等相关技术；具有良好的团队合作精神和沟通能力，能够与跨部门的团队紧密合作，共同推动项目的成功；具备较强的学习能力和责任心，能和团队一起探索新技术，对业务产生价值。