岗位职责:1、模型应用:熟练使用deepseek大模型并在其基础上在特定领域(如文本生成、问答系统、图像识别等)进行场景开发。2、模型微调与优化:针对具体业务需求,对大模型进行精细化微调,提升模型在特定任务上的性能和准确性。参与模型架构调整、参数优化、超参数搜索等工作,以实现模型效果的最优化。3、模型部署与集成:负责将训练好的模型部署到云端或边缘设备上,确保模型在实际应用场景中的高效、稳定运行。参与设计并实现模型服务的API接口,与前后端开发人员紧密合作,完成系统集成。4、性能评估与迭代:建立科学的模型评估体系,对模型性能进行持续监控和评估。根据反馈结果,不断优化模型结构和参数,推动模型迭代升级。5、技术研究与分享:跟踪人工智能领域的最新研究进展,特别是大模型相关的技术动态。积极参与内部技术分享会,提升团队整体技术水平。任职要求:1、硕士及以上学历,计算机科学、数学、电子信息工程相关专业,有一定的机器学习、深度学习理论基础。2、熟悉 PyTorch、TensorFlow 等主流深度学习框架,有大模型(NLP)应用、微调经验者优先。3、熟练掌握Python编程语言,熟悉Linux操作系统,了解自然语言处理、计算机视觉等领域的基本概念和常用算法,具备解决复杂问题的能力,能够独立完成项目任务。4、有较强的创新意识和探索精神,能够不断尝试新技术、新方法,推动项目创新。6、有良好的沟通能力,能够与团队成员有效协作,共同推进项目进展;有成功部署并商业化应用大模型项目的经验或在学术会议或期刊上发表过相关论;熟悉云计算、容器化、微服务架构等技术者优先。