职责描述:1、负责行业大模型、多模态大语言模型的技术研发工作,聚焦行业模型的增量训练、精调、强化学习、多模态特征的对齐等技术研究;2、负责大模型前沿技术跟踪与技术洞察,评估并整合前沿技术到公司产品中;3、负责前沿技术成果转化与落地应用,参与项目技术研发与交付;4、参与规划部门战略、技术路线及发展策略;5、解决复杂的技术问题,提供创新的技术解决方案。6、指导和培养团队成员,提升团队整体技术水平。任职要求:教育程度:硕士工作经历:1、自然语言处理、人工智能等相关专业,硕士及以上学历,博士优先,10年以上算法研发经验,有大模型算法方向工作经验者优先;2、熟悉了解Llama3、Qwen、Stable Diffusion等开源大模型,有垂域大模型、多模态大模型研发经验者优先;3、良好的算法开发和工程实现能力,熟悉常用机器学习、深度学习框架(如TensorFlow、PyTorch等),熟悉大模型训练框架DeepSpeed、Megatron等;4、熟悉Python/C/C++等编程语言,良好的编码习惯和一定的工程能力 ;5、对大模型、自然语言处理、语音交互等至少一个领域有深入研究;6、具有带领团队攻坚经验者优先;具备良好的问题分析和解决能力,对解决具有挑战性的问题充满热情;7、具备一定的算法研究和创新能力,如在相关领域高级会议发表过高水平论文者优先。所需专业:自然语言处理、人工智能等相关专业其他要求:具有良好的团队合作精神、口头及书面沟通能力及抗压能力。语言要求:大学英语六级以上