工作职责1. 参与智能座舱场景下大模型(语言/多模态)的构建、训练与优化,包括模型架构设计、预训练/微调策略制定。2. 负责模型性能调优,通过量化(INT8/FP16)、剪枝、蒸馏等技术实现轻量化,适配高通、MTK等车机芯片平台。3. 开发车载场景专属的模型压缩工具链。4. 构建面向智能座舱的多模态数据集(语音指令、车内视觉、传感器数据),设计数据清洗、增强与标注方案。5. 开发数据闭环系统,实现用户行为数据采集-模型迭代-OTA升级的自动化链路。6. 与团队协作完成模型从云端训练到车机端侧部署的全流程适配,解决内存、算力、时延等性能瓶颈。任职资格1. 精通Transformer、MoE等大模型架构,熟悉LLaMA、Qwen、DeepSeek等开源模型生态。2. 掌握PyTorch、TensorFlow框架,具备千亿参数级模型训练经验者优先。3. 熟悉模型压缩技术(量化、剪枝、知识蒸馏),了解ARM NEON指令集、GPU并行计算优化、车载NPU芯片优化等,具备端侧推理优化经验优先;4. 熟悉NLP/CV/语音数据处理流程,掌握CLIP、Whisper等多模态模型应用;5. 熟练使用性能分析工具(Perfetto、Systrace),能定位GPU/CPU瓶颈并提出优化方案。6. 具备跨团队协作能力,可高效对接算法、嵌入式、产品团队,推动技术方案落地。7. 强烈的技术好奇心与自驱力,能快速学习新技术并解决复杂问题。