【工作内容】- 负责大模型的架构设计与实现,确保模型在大规模数据集上的高效运行。- 参与从数据预处理到模型训练、评估、调优以及部署的整个流程,确保模型性能达到最优。- 深入研究深度学习领域的新技术和新方法,探索其在实际项目中的应用可能性。- 与团队成员紧密合作,进行跨部门沟通,以解决技术难题,提升产品性能。【任职要求】- 计算机科学或相关领域的本科及以上学历,拥有3年以上相关行业的工作经验。- 熟练掌握Python等编程语言,熟悉TensorFlow、PyTorch等主流深度学习框架。- 具备扎实的机器学习理论基础,对神经网络架构有深入理解。- 具备大模型训练全流程的经验,包括但不限于数据清洗、特征工程、模型训练与调优等。- 强烈的责任心和良好的团队协作精神,能够承受一定的工作压力。- 英语读写能力良好,能快速查阅英文文献和技术文档。