岗位职责:1、负责语音/多模态/NLP/CV等领域模型研究,以及下游任务的训练、开发及优化;2、利用Diffusion类AIGC技术进行智能创作,如视频生成、音乐生成,应用于AI玩法创新;3、负责llm/mllm的建设和落地,不限于SFT、Prompt、RAG、Tools等,应用于Agent落地;4、负责音视频智能标签识别能力建设,搭建结构化标签体系,包括类目/属性/质量/关键词等;任职要求:1、对CV、多模态、AIGC等相关领域有深入的理解,且有相关实际项目经验;2、熟悉python/Pytorch等,计算机相关专业;3、熟悉Diffusion+ControlNet类技术;熟悉llm+Agent,并有落地者优先;有语音算法经验者优先,如tts、asr、音频分类、歌曲生成等;4、有责任心,乐于沟通,优秀的业务sense;有强烈的上进心,善于学习新事物;5、有良好的数据敏感性,解决问题的优秀能力