岗位职责负责AI模型工程化相关工作,如框架设计、模型优化、推理加速等。 任职要求1、计算机、人工智能等相关专业本科以上学历,3年以上工作经验,具备扎实的C/C++/Python/CUDA等编程经验及工程化经验2、熟悉深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型3、熟悉AI常用训练和部署(如PyTorch/DeepSpeed/QNN/vllm/TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理 4、熟悉常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链5、有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先6. 加分项:2年及以上大模型分布式推理引擎开发经验;国际竞赛和核心会议发文7、加分项:有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先8、加分项:有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先