岗位职责1. 基于TensorFlow、PyTorch等框架,对大模型进行分布式训练、微调及性能优化(如量化压缩、低秩分解等技术),提升训练效率和推理速度,能够结合业务场景需求,设计强化学习、长序列训练等调优策略;2. 基于通用大模型,通过RAG(检索增强生成)、领域知识注入、数据蒸馏等技术,构建适配公司业务的轻量化垂直模型;3. 建立本地知识库的自动化清洗、标注及回流机制,提升模型领域适配性;4. 根据公司业务需求,开发基于大模型的智能体(Agent)系统,支持ReAct、GraphRAG等复杂推理范式,实现任务自动化与多模态交互;5. 制定AI使用规范,定期开展模型安全评估与风险防控;6. 为团队和其他部门提供培训,传播AI技术和应用方法,提高公司的整体技术水平。岗位要求1. 计算机科学、人工智能、数学等领域本科及以上学历;2. 熟悉主流大模型技术(如GPT、Llama、DeepSeek等)及开源框架(Hugging Face、LangChain等)。3. 熟悉大模型部署工具(如TensorRT-LLM、vLLM、Triton)及容器化技术(Docker/K8s)4. 熟悉主流大模型架构(如Transformer、MoE)及调优方法(如LoRA、Prompt Tuning)5. 精通Python/C++,熟悉TensorFlow/PyTorch框架,具备分布式训练、模型压缩加速经验者优先。6. 具备智能体开发经验,熟悉Agent框架(AutoGen、MetaGPT等)及RAG技术实现7. 熟悉数据安全技术(数据脱敏、访问控制、加密传输等),了解《数据安全法》等法规;8. 扎实的编程能力(Python/C++),熟悉Linux开发环境及Shell脚本。经验要求:1. 2年以上大模型相关经验,主导或参与过完整的大模型本地化部署或垂直领域优化项目;2. 具备高性能计算经验,熟悉CUDA、NCCL、GPU/TPU集群资源的管理;3. 具备良好的跨部门协作沟通能力,有团队合作精神;4. 具备多模态模型应用开发经验者优先;5. 有地质学、GIS领域知识者优先。