工作内容:1、模型微调与优化:参与大模型在OA协同办公业务场景下的应用,包括但不限于:基于公有云大模型做局部私有资料的对接微调,基于私有大模型做垂直领域的数据抓取、自动标注、微调训练;2、应用落地:负责大模型的模型适配与应用落地,包括但不限于LLM、Langchain、Agent、Eval等技术;3、性能评估监测与部署:定期监控模型性能,进行在特定应用场景下的各类模型能力的评估,确保模型达到业务要求,能够进行模型的容器化部署。技能要求:1、参与过大模型相关开发工作,包括但不限于:数据清洗、训练框架开发、评测、推理部署等; 有针对开源模型实际微调 ,并使其形成行业领域模型者优先。 2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;7、熟悉Docker、Kubernetes等容器化技术。