工作内容:1、负责大模型的算法研发,训练的加速,并进行场景落地; 2、针对特定应用场景进行算法分析、优化负责大模型训练数据建设的工作,包括数据获取、数据清洗和数据结构化等; 3、研究数据与大模型训练之间的关系,构建适合大模型方向的数据管理体系; 4、负责对上线项目问题及时跟进处理。 岗位要求: 1、熟悉机器学习,深度学习,自然语言处理等领域的专业知识,具有3年以上工作经验,有成功的落地项目(作为主要负责人); 2、拥有优异的编码能力、分析和解决问题能力,对解决具有挑战性问题充满激情,至少掌握python或C++其中之一; 3、熟悉分布式训练原理和开源训练框架,如LLMfactory、Megatron-Deepspeed等; 4、熟悉transformer框架,阅读过源码。有过Bert,GPT等的实际训练和业务落地经验; 5、熟悉文本生成,nl2sql等,有相关的优化经验优先。