1.设计、开发和优化大规模AI模型的训练流程和算法,包括损失函数的选择和优化。2.配置和管理内网环境中的计算资源,确保高效利用并满足训练需求。3.处理大规模数据集,进行数据预处理和特征提取。4.理解并调试模型训练时的参数,优化损失函数等指标,提高模型性能和收敛速度。5.开发和实现模型评估和验证的方法与指标,提升模型质量和性能。6.与团队研发组、数据组、测试组成员紧密合作,解决模型训练过程中的技术问题和挑战。任职要求:1.计算机科学、人工智能或相关专业的本科及以上学历。2.深度学习和神经网络的理论基础,熟悉常见的深度学习框架(如TensorFlow、PyTorch等)。3.掌握Python编程语言,熟悉常用数据处理和机器学习库。4.具备优化损失函数的能力,改进模型的输出质量和准确性。5.熟悉调试模型训练时的参数,优化模型性能。6.熟悉内网环境下的显卡配置和管理,具备相关实践经验。7.具备良好的问题解决能力和团队合作精神。8.对自然语言处理、计算机视觉等领域有相关经验者优先考虑。9.英文读写能力良好,能够阅读和理解学术论文和技术文档。