岗位职责:1. 深度参与公司大规模预训练模型研发,包括架构设计、训练、微调和推理等环节的系统性研究;2. 负责大模型训练、微调、推理框架的优化;3. 负责面向公司产品的人工智能算法研发,包括但不限于语义理解、自动摘要和可控文本生成;4. 跟踪学术界和工业界前沿技术,推动相关算法在公司项目中实际落地。任职要求:1. 硕士研究生及以上学历,计算机、人工智能等相关专业优先,3年以上AI算法工作经验,对新技术充满热情;2. 具备出色的编码能力,扎实的数据结构和算法础;熟练掌握至少一种深度学习框架,如 Tensorflow 、 PyTorch 等;3. 有优秀的逻辑思维能力和数据分析能力,善于分析和解决问题,良好的团队合作意识和沟通能力;4. 对业务和数据敏感,有大模型在对话、语音交互、智慧商业方向的落地经验优先考虑;5. 熟悉 BERT 、 GPT-3、 BART 、T5 等大模型预训练;6. 熟悉 Diffusion 、 GPT 等前沿技术。