职位描述:1. 前沿技术跟踪:12 持续跟踪国内外多模态大模型(如GPT-4V等)和大语言模型(如LLaMA、Phi、Gemni、ChatGLM、DeepSeek、qwen等)的最新研究进展与技术动态;12 分析技术趋势,提炼可落地的优化方向和应用场景。2. 模型优化与轻量化:12 负责端侧(移动端/嵌入式设备)小模型的性能优化,包括但不限于模型压缩(量化、剪枝、蒸馏)、推理加速、内存与功耗优化;12 探索多模态大模型向端侧轻量化落地的可行性方案。3. 算法研究与开发:12 参与多模态(文本、图像、视频、语音)融合算法研究,提升模型在低资源环境下的泛化能力;12 针对垂直场景需求,设计高效的小模型架构或适配方案。4. 实验与部署:12 设计模型性能评测基准,主导实验验证与效果分析;12 协同工程团队完成模型端侧部署,优化实际业务场景中的推理效率。5. 技术沉淀与输出:12 撰写技术文档、专利及学术论文,推动团队技术影响力;12 参与开源社区贡献,跟进行业标准与工具链更新。6. 团队培育和成长:12 逐步带动和培育团队;职位要求:1. 教育背景:12 计算机科学、人工智能、电子工程等相关领域硕士及以上学历,博士优先;12 有顶会论文(CVPR/ICML/NeurIPS/ACL等)或开源项目经验者优先。2. 技术能力:12 熟悉主流大模型架构(Transformer、MoE等)及训练方法(预训练、指令微调、RLHF);12 精通多模态模型(如视觉-语言模型、跨模态检索)关键技术,熟悉对比学习、跨模态对齐等算法;12 熟练掌握PyTorch/TensorFlow等框架,具备端侧部署经验(TensorRT、ONNX、CoreML等);12 熟悉模型轻量化技术(如知识蒸馏、量化感知训练、动态网络裁剪)。3. 工程能力:12 扎实的Python/C++编程能力,熟悉Linux开发环境;4. 软性要求:12 强烈的技术热情,能快速复现前沿论文并改进创新;12 优秀的英文阅读和交流能力及跨团队协作沟通能力。加分项61 有多模态应用(如AIGC、智能助手、机器人)落地经验;61 参与过主流开源项目(如Hugging Face、LangChain、Llama.cpp)。