工作内容:负责AI大模型的分析与训练工作,与产品开发团队配合不断优化提升AI大模型效果。具体工作内容包括但不限于:- 深入理解大规模预训练语言模型,参与模型评测方案的制定与评测数据集的建设。- 通过对模型进行全方面细致的评测,明确模型能力边界,对模型能力进行深入分析,产出围绕大模型的客观认知,从而为模型训练迭代提供指导意见。- 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。- 深度参与大模型训练及应用,提供评测及相关的模型分析支持,共同推动大模型的训练与应用。- 良好的项目管理能力,有一定的抗压能力和优良的意志品质。职位要求:- 本科及以上学历,计算机、数学、统计学或相关专业;- 了解Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力- 对机器学习或深度学习算法的基础知识,自然语言处理或大模型相关算法和模型感兴趣;- 良好的沟通能力、团队合作精神以及较强的问题解决能力。- 紧跟人工智能行业进展,对前沿技术和行业趋势有比较高的敏感度- 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能;- 有生成式大模型研究经验;- 有项目经验的优先。