岗位职责:1、负责大模型相关场景的工程化落地,探索业界先进的大模型(及架构)、Agent技术/框架、前沿RAG技术等;2、围绕大模型(包括多模态)领域,构建从数据采集、加工标注、算法训练部署至推理加速等;3、负责大模型的结构设计、训练、微调、部署和优化,提高模型的效率、稳定性和可扩展性;4、跟踪国内外前沿的大模型技术动态,持续改进和优化现有模型;5、负责知识图谱(知识及index)全自动化构建,全流程(抽取、融合、消歧等)优化等。任职要求:1、博士学历,计算机、人工智能等相关专业;2、实验能力强(可快速复现前沿技术并评估可行性)、实战能力强(技术方案通过可行性评估后,具备独立封装算法模型的能力);3、精通Python、C/C++(可选)等编程语言,熟练掌握PyTorch等主流深度学习框架,Transformers、Vllm等;4、熟悉大模型分布式训练技术和框架库,如DeepSpeed等,熟悉框架库源码,有10至100卡以上集群(多机)的大模型训练经验;5、熟悉知识图谱相关技术原因、图数据等技术;精通大模型推理优化技术、精通各种微调技术,如LoRA、QLoRA、SFT、DPO等。