岗位职责:1. 负责开发和支持大模型的部署、推理和应用集成;2. 业务场景适配:针对具体业务需求,完成模型的微调、领域适配及效果验证。构建基于大模型的端到端解决方案,推动模型在业务场景的规模化应用;3. 工程化与部署 :设计分布式框架,提升效率,实现模型的高效部署。4. 参与公司内部项目的需求搜集评审、开发测试,通过大模型等技术向公司产品和业务部门赋能;5. 参与系统架构设计,建设大模型应用平台,提升现有系统的稳定性;6. 跟踪大模型在公司各领域的发展趋势与落地实践,探索大模型技术如何改进业务效率;7. 深入研究并推动大模型技术在公司内部多个业务场景中的应用落地,保障技术能有效带来商业价值;8. 研究人工智能大模型和工具,建立公司自有知识库。岗位要求:1. 计算机科学、人工智能、数学等相关专业,本科及以上学历;2. 熟练掌握Python/C++,熟悉PyTorch/TensorFlow/JAX/vLLM/TensorRT-LLM 等框架。深入理解深度学习原理,熟悉Transformer、BERT、GPT等大模型架构。具备分布式训练经验,熟悉显存优化技术。熟悉NLP/CV领域任务,或具备多模态模型开发经验;3. 对大模型有技术热情,熟悉主流大模型,如Gemma/chatGPT/LLaMA/Qwen等,对模型背后的原理和差异有深入的理解;4. 熟悉基本的大模型应用技术 Prompt Engineering,RAG,Agent,SFT 等工作原理,熟练使用 LangChain,LlamaIndex 等大模型应用框架。