工作职责:负责AI模型工程化相关工作,如框架设计、模型优化、推理加速等。 任职资格:1、计算机、人工智能等相关专业本科以上学历,3年以上工作经验,具备扎实的C/C++/Python/CUDA等编程经验及工程化经验;2、熟悉深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型;3、熟悉AI常用训练和部署(如PyTorch/DeepSpeed/QNN/vllm/;TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理 ;4、熟悉常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链;5、有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先;6、加分项:2年及以上大模型分布式推理引擎开发经验;国际竞赛和核心会议发文;7、加分项:有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先;8、加分项:有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先。