工作职责:1、负责公司视频+图像模态的实时交互算法能力的建设,包括视频和图像的理解能力、生成能力。2、立足全模态,开展数据工程、模型设计、算法训练等工作,从数据、模型、场景优化等角度推进算法在终端等场景的应用。3、探索业界前沿算法,持续创新和突破,保持行业领先水平,建设全模态实时人机交互系统。任职资格:1、计算机相关专业,硕士及以上学历,1年及以上深度学习的项目经验。2、有视觉多模态领域的算法经验,熟悉CLIP、VLM等结构和原理,掌握目标检测、实例分割技术,有较强的算法设计、编程实现和模型训练能力。3、熟练使用C++/Python,熟悉 Linux开发环境和shell,熟悉Pytorch框架以及分布式训练。4、具备钻研精神和创造力,有较强的分析问题解决问题能力,工作踏实上进,有良好的团队合作意识。5、在***会议发表过学术论文者或在国际竞赛取得优异成绩者优先。