工作职责:1、负责公司全模态实时交互算法能力的建设,涉及方向包括不限于:视频、图像、音频、文本等多模态内容的理解与生成等。2、立足全模态,开展数据工程、模型设计、算法训练等工作,从数据、模型、场景优化等角度推进算法在终端等场景的应用。3、探索业界前沿算法,持续创新和突破,保持行业领先水平,建设全模态实时人机交互系统。任职资格:1、计算机相关专业,硕士及以上学历,有深度学习的项目经验。2、有多模态、NLP、CV中某个领域的研究或实习经验,熟悉CLIP、LLM、VLM等结构和原理。3、熟练使用C++/Python,熟悉 Linux开发环境和shell,熟悉Pytorch框架以及分布式训练。4、具备钻研精神和创造力,有较强的分析问题解决问题能力,工作踏实上进,有良好的团队合作意识。5、在***会议发表过学术论文者或在国际竞赛取得优异成绩者优先。备注:需要实习3个月后,根据表现发offer,同时实习到毕业。