岗位职责:1.系统架构设计:负责规划和设计用于训练和部署生成式模型的计算架构,确保系统的可扩展性、性能和可靠性。2.基础设施开发:主导构建高效的分布式训练环境,包括但不限于集群管理、资源调度、自动化运维等,以支持大规模模型训练的需求。3.技术创新:探索最新的算法和技术,如Transformer架构及其变体,提出并实施技术改进方案,持续提升模型训练效率和质量。4.性能优化:分析现有数据处理流程,识别瓶颈并提出改进措施,提高数据处理效率和资源利用率。5.技术选型与研究:跟踪最新的生成式模型技术和工具,评估其适用性,为团队引入***实践和技术方案。6.跨部门协作:与产品、研发和其他相关部门紧密合作,理解业务需求,提供技术支持和指导,确保技术方案满足实际应用场景的要求。7.团队指导:作为技术领导者之一,指导和培养团队成员,分享专业知识,促进团队整体技术水平的提升。任职要求:1.统招本科及以上学历;拥有计算机科学、数学、统计学或相关领域的硕士以上学位。2.精通深度学习框架(如TensorFlow, PyTorch)及其实现原理,有实际项目经验。3.对生成对抗网络(GAN)、变分自编码器(VAE)、Transformer等生成式模型有深入了解。4.关注 AI 行业动态和学界最新研究成果,精通生成式模型性能评估方法。5.丰富的云计算平台使用经验,熟悉容器化技术和微服务架构。6.熟练掌握 Python编程语言,具备良好的编码习惯和工程能力。7.具备出色的沟通能力和团队合作精神,能够有效地传达复杂的技术概念。加分项:1.在大规模机器学习系统或超大型数据集上进行过模型训练的实际经验。2.参与开源社区贡献或个人技术博客,展现对技术的热情和见解。4.拥有专利申请、学术论文发表或其他形式的技术成果展示。