工作职责;1、大模型研究与前沿技术探索:跟踪和研究国内外先进的大模型技术和算法,为公司的大模型开发提供技术选型和创新思路;参与大模型的架构设计和优化,确保模型具有高效的计算性能、良好的可扩展性和准确性;2、算法开发与实现:负责AI相关算法的选型、实现和优化,包括但不限于自然语言处理、计算机视觉、语音识别等领域的算法;负责设计和优化大模型算法的训练技术,如自注意力、Transformer等;3. 模型训练与评估:负责模型的训练和调优,制定合理的训练策略和超参数设置,以提高模型的训练效率和效果:对训练好的模型进行评估和验证,使用各种指标(如准确率、召回率、F1 值等)来衡量模型的性能,并提出改进方案;4. 模型部署与集成:将训练好的模型部署到生产环境,确保其稳定运行和高效服务;将模型与公司的产品和业务系统进行集成,确保模型能够在实际应用中落地。岗位要求:1、硕士及以上学历(获得鸿鹄绿通卡者可放宽至本科),计算机科学、数学、统计学、电子工程等相关专业;2、精通深度学习算法和模型,如Transformer、GPT等,具备扎实的理论基础;熟练掌握至少一种主流的深度学习框架,如TensorFlow、PyTorch等;3、熟练掌握Python、java等编程语言,具备良好的代码规范和编程习惯;熟悉docker等容器技术,熟练使用Linux操作系统;4、具备独立进行模型训练、调参和优化的能力,能够提高模型的性能和准确性;5、了解模型压缩、量化等技术,以优化模型在实际应用中的效率;6、具有较强的创新意识和解决复杂问题的能力,能够提出新颖的算法和解决方案;7、具备自然语言处理或相关领域的实践经验优先;在相关领域发表过高质量的学术论文或拥有相关专利者优先;8、具备良好的团队合作精神,能够与不同背景的团队成员有效沟通和协作。