学历要求 硕士及以上学历 专业要求 数学、物理、统计、计算机、通信、软件工程、信息工程等相关专业,具有人工智能领域 岗位职责 1.负责大模型领域前沿算法研究及技术创新,如LLM自然语言大模型、生成式AI技术等技术; 2.负责大模型整体技术方案及算法研发,并结合实际应用场景进行算法落地,实现商业价值; 3.负责制定大模型训练、调优等方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 4.负责AI技术方向的专利、标准、软件著作权布局,完成年度科研计划、部门安排的其他工作。 应聘资格要求 1.硕士及以上学历,计算机、软件工程、电子信息工程、人工智能、大数据、数学、自动化等相关专业优先; 2.了解或熟悉Python、C++、shell编程,熟悉CUDA架构,熟练使用Pytorch\Tensorflow计算框架,有一定的SQL编写能力、熟悉linux常用命令; 3.拥有大模型部署、微调经验,对深度学习有一定理解和实操经验; 4.具备良好的学习能力,责任心强,有良好的沟通和团队协作能力。