工作职责1、开发垂直领域文本大模型;针对特定用户群体(操作员、SMT工艺工程师、设备维护人员等)提供常见问题(设备故障诊断、温度曲线解读、工艺参数优化等)的专业指导及行业报告生成2、依据现有开源大模型基座(LLaMA,GPT-Neo等),选取适当规模模型进行测温监测系统架构设计、开发、优化,确定测温和炉温监控领域知识增强方案3、依据设备技术文档参数设置,炉温曲线,焊接质量报告,工艺调整案例库参数,IPC/JEDEC标准文档,实施模型的预训练、微调和强化学习优化4、多模态数据融合功能开发,如:温度曲线图像-文本描述生成,工艺参数表格-自然语言总结,焊接缺陷图片-故障诊断报告5、边缘计算部署优化,根据模型实际运行表现及用户反馈持续迭代改进模型,同时维护更新领域内知识库6、探索大模型在公司其他业务场景应用的可行性,实现大模型技术的标准化与产品化任职资格1、计算机科学、人工智能、数学计算机相关专业硕士及以上学历2、熟悉LLaMA、ChatGLM等主流大模型架构掌握Prompt Engineering和In-context Learning技术,具备大模型微调(Full Fine-tuning/LoRA/P-tuning)经验3、熟悉自然语言处理相关理论,熟悉Transformer/BERT/GPT等基础模型结构,熟悉大模型的微调和评估方法;具备扎实的Python、C 、Java等编程基础,熟悉主流深度学习工具TensorFlow/PyTorch等4、有多模态处理经验优先:处理文本、表格、图片等多模态数据,构建语义检索系统或信息抽取模型5、有良好的数据敏感性和逻辑推理能力,较好的学习和沟通能力