岗位职责:1、资料预处理: 设计并实现高效的数据采集、清洗、标注和预处理流程。 构建大规模数据集,确保数据质量,支持模型训练的需求。 开发自动化工具或脚本以提高数据处理效率。2、模型开发: 参与生成式大模型的设计、实现和优化,包括但不限于Transformer架构及其变体。 编写高效的模型训练代码,使用深度学习框架(如TensorFlow, PyTorch)进行实验和调参。评估模型性能, 分析结果,提出改进措施。3、技术选型与研究:跟踪最新的技术和工具,评估其适用性,为团队引入***实践和技术方案。4、协作与沟通: 与其他部门紧密合作,理解业务需求,提供技术支持。任职要求:1、统招硕士学历;拥有计算机科学、数学、统计学、电气工程或相关领域的硕士以上学位。2、精通Python和其他编程语言(Java,JavaScript等),熟悉SQL及常用数据库操作。3、具备扎实的机器学习基础,特别是对生成对抗网络(GAN)、变分自编码器(VAE)、Transformer等生成式模型有深入了解。4、熟悉至少一个主流深度学习框架(如TensorFlow, PyTorch),并有实际项目经验。5、能够独立工作,同时也能作为团队成员有效协作。6、强烈的好奇心和持续学习的动力。7、良好的沟通技巧,能够清晰地向非技术背景的同事解释复杂的概念和技术细节。加分项:1、在大规模机器学习系统或超大型数据集上进行过模型训练的实际经验。2、具有构建和维护用于训练和推理的大规模分布式计算平台经验者优先。3、有参与开源社区贡献或个人技术博客/作品集展示者优先考虑。