岗位描述:1. 负责语音识别、语音合成、端到端语音交互大模型算法的研究和应用落地。2. 参与语音识别与合成技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音识别与合成核心技术效果。3. 参与语音相关大模型的训练、微调(Fine-tuning)和部署,优化推理效率减少时延并提升资源利用率,推动模型在生产环境的落地和规模化应用。4. 深入调研和研究音频/NLP/多模态/全模态等方向的前沿技术,结合语音、文本、图像等跨模态能力,探索语音技术与大语言模型的结合,持续探索语音技术的新能力和新应用。岗位要求:1. 计算机科学、人工智能、语音处理、机器学习或相关领域的硕士及以上学位。2. 至少2年在语音、自然语言、语音翻译、声音复刻、数字人等相关领域的研发经验,深入理解语音算法原理,熟悉模型压缩、剪枝、量化、蒸馏及推理加速方案,能平衡性能与资源消耗。3. 熟悉深度学习在语音领域的核心技术,具备语音大模型(例如 Whisper、Wav2Vec 2.0、Conformer、SpeechT5、AudioLM等)的开发、精调和优化经验,了解其底层架构原理,有垂直行业定制化语音应用经验者优先。4. 对语音大模型及相关前沿科技充满热情,能够高效探索新方向并推进落地,具有优秀的技术沟通能力和良好的团队协作精神。该岗位由浙江信产技术有限公司签约并安排至浙江省公众信息产业有限公司项目部工作。