岗位职责:负责开发和优化用于大规模文档解析的算法和工具。追踪并实现前沿大模型相关思想、技术和应用,包括模型微调(Fine-tuning)、指令微调(Instruction Tuning)、工具调用(Function Calling)以及Rag等技术。参与数据集的构建、清洗、标注和评估,确保训练数据的质量满足模型训练需求;任职资格:硕士及以上学历,计算机相关专业应届生,985院校毕业优先具备良好的算法实现能力,熟悉TensorFlow/Pytorch等深度学习框架(至少熟练掌握一种)熟练掌握文档解析/文档理解、大模型SFT、Agent、Prompt优化、数据生产等方向之一,且对其运行原理有较好的理解有大模型相关项目开发经验,有包括Prompt优化、Rag、大模型SFT训练经验者优先在NLP领域***学术会议发表过高质量文章者优先,在业界知名竞赛中取得过奖项者优先熟悉Linux操作系统与Shell脚本编写