工作职责:1、研究和开发多模态处理算法和模型,包括但不限于:图像、视频、声学信号的理解与生成、多模态信息和文本信息的对齐和整合2、设计和优化现有算法,提高性能和准确性,确保高质量的客户体验任职资格:1、包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业硕士2、熟练掌握主流深度学习框架,如TensorFlow、PyTorch,并具备良好的编程能力3、对NLP/CV/多模态领域的经典模型(如GPT、VIT、LLaVA等)有深入理解,熟悉相关任务和评测方法4、较强的工程实现能力,熟练掌握 C/C++ 编程,熟悉 Shell/Python/Matlab 至少一种编程语言