工作职责:1.收集和处理大规模的数据集,以满足模型的输入和输出需求2.使用先进的优化技术,提高模型的训练速度和效果3.评估和分析模型的性能、鲁棒性、可解释性和可扩展性4.跟踪和掌握最新的大模型研究进展和趋势5.负责AIGC相关研究包括但不限于大模型训练、微调、提示词工程等在开源的LLM等语言大模型、新的图像生成模型如diffusion models、多模态生成模型等研发工作;6.负责研发布署相关细节,如指定场景的优化提示词与提供内部文档库使得模型行为符合场景要求、根据特别场景的模型微调、模型蒸馏与量化、图像生成模型针对特别场景的客制化等。7.参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。任职资格:1.具有计算机科学、数学、统计学或相关领域的硕士或博士学位2.具有深度学习、机器学习、自然语言处理、计算机视觉或相关领域的研究经验3.熟悉大模型的理论和实践,包括模型架构、数据处理、优化技术、性能评估等4.熟练使用至少一种深度学习框架,如TensorFlow、PyTorch、MXNet等5.熟练使用Python、C++等编程语言,以及常用的数据分析和可视化工具6.具有良好的沟通和协作能力,以及创新和解决问题的能力7.优秀的编程能力,精通Python/C++,熟悉PyTorch分布式训练8.熟悉前沿的神经网络架构(Transformer,ViT,CLIP)并有实际动手经验,非常熟悉pytorch, huggingface, cuda等技术栈9.具备深厚的NLP基础和前沿跟踪能力,具备大模型预训练,文本生成,多伦对话实战经验优先;10.在内容生成方向有较为深入的研究和探索,富于热情,自驱力强,勇于进行创新实践和技术突破11.关注NLP及多模态生成领域的业界最新动态,如ChatGPT、Midiourney等。