岗位职责:1、通过NLP基础算法,构建高质量文本数据,能够洞察基础大模型在不同任务、行业中的不足,持续拓展基础语言大模型的知识边界;2、探索行业大模型定制算法,应用预训练、SFT、强化学习等技术提升语言大模型的专有知识储备、语言理解、推理能力;岗位要求:1、计算机或者相关专业硕士或者以上学历,具备2年以上NLP算法/分布式大模型训练工作经验;2、熟练掌握Python、C、C++等一门以上的编程语言,熟悉掌握TensorFlow、Pytorch等深度学习框架,熟练使用多机多卡训练方法,能够熟练使用Spark、hadoop等大数据处理框架;3、熟练NLP基础算法,例如词性标注、句法分析、实体识别等任务,在阅读理解、机器翻译、对话系统等方向具有深入研究;4、良好的逻辑思维能力,扎实的机器学习基础,擅长具体问题具体分析,并具备高效的工程动手能力;5、在NeurIPS、ACL、ICML、AAAI、EMNLP等会议期刊以***作者发表过文章的优先;