1. 侧重文-图-视频的多模态算法研发,致力于研究和开发前沿的多模态算法,结合医疗邻域的业务和经营,推动多模态在医疗业务/产品规模化应用与发展。2. 具体职责包括但不限于:1)结合深度学习等前沿技术,开展跨模态理解与生成等相关技术的研发工作;2)结合前沿技术进行技术创新,多模态模型在业务和产品上的落地应用,比如智能PPT生成、数字人讲解、数字人人机交互等。任职要求:1. 本科及以上学历,计算机技术、人工智能、模式识别、应用数学等相关专业背景,熟练掌握多模态相关算法,良好的算法实现能力;2. 熟悉图文/视频文本多模态建模,在以下一个或多个领域有深入的研究及落地经验,包括但不限于:自监督/多模态弱监督,基础大模型预训练、跨模态检索与生成、视频分析理解、RAG、AI agent等3. 要求至少熟练掌握PyTorch、TensorFlow等框架中的一种,熟悉 Shell/Python 等常用语言;4. Coding能力强,有良好的C++/Python编码习惯,能够快速设计并执行实验、验证想法、具备能支持全栈研发的能力;5.优秀的分析问题和解决问题的能力,有技术有极致的追求,有超强的学习能力,愿意接受挑战,有强烈的好奇心及执行力。6.拥有以下任意一项条件者优先: 1)有发表学术论文、特别是会议或期刊的学术论文经历,如CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/AAAI/SIGGRAPH等(排名不分先后); 2)有多模态图文内容生成系统全流程开发(例如数据采标、数据清洗、模型设计、跨域对齐、提示词工程、性能评测等)经验者优先。