岗位职责:多模态大模型定制化训练与优化,满足建筑垂直领域业务需求,负责从数据准备到模型微调、服务部署的全链路工作,利用最前沿的大模型技术推动AI技术在实际场景中的创新应用。具体如下:1. 大模型微调与训练:负责大语言模型及其它类型大模型的微调和训练工作,通过先进技术如LoRA(Low-Rank Adaptation)和强化学习等方法,确保模型能够精准适配建筑施工垂直领域的业务需求,提升模型在特定任务上的性能和效率。2.数据处理与增强:深入参与数据构造与数据增强流程,设计并实施高效的数据预处理策略,提高数据质量与多样性,为模型训练提供坚实基础。这包括但不限于数据清洗、标注、合成以及采用先进的数据增强技术来提升模型泛化能力。3.知识库与AI Agent开发:熟练运用langchain框架和llama-index框架,设计并实现高效的知识管理系统和AI交互代理,促进信息的有效组织、检索与利用,推动AI系统的智能化水平迈向新高度。4.大模型Prompt调优:精通Chain of Thought (COT)等高级prompt工程技巧,优化模型输入指令,引导模型产生更准确、逻辑性更强的输出,提升模型解决复杂问题的能力和用户体验。5.VLA(Vision-Language-Action)模型开发:开发VLA模型驱动机器人/施工装备作业任务。6.大模型可解性性提升:采用知识图谱嵌入、RAG、探针等技术,解释大模型决策过程,增强可解释性。7.模型服务部署与维护:了解GPU、服务器等硬件环境,熟悉大模型服务部署框架,负责将训练好的模型部署至生产环境,构建稳定、高效、可扩展的模型服务架构,确保模型对外服务的高可用性和安全性,支持多场景的快速接入与应用。任职要求:1.本科及以上学历,计算机、人工智能、自动化等相关专业优先。2.具有良好的编程基础,熟练掌握C/C++、Python等编程语言,熟悉Linux指令及服务器运维。3.熟练掌握PyTorch, Transformers, Huggingface等使用。4.熟悉常见GPU硬件、常见的模型服务部署技术。5.学习能力强,能够流畅阅读中英文文献及专利。