【岗位职责】1、参与公司大模型的架构设计和算法选型,结合业务需求和技术趋势,提出创新性的设计方案和技术思路。2、负责大模型的代码实现和开发工作,不断探索和优化大模型的性能。3、负责收集、整理和清洗大规模的训练数据,确保数据的质量和一致性,为大模型的训练提供有力支持。4、设计和制定数据标注规范和流程,保证标注数据的准确性和有效性。5、制定合理的模型训练计划和策略,对训练过程进行监控和分析。6、参与公司内部的技术交流和分享活动,与团队成员共同探讨技术难题和解决方案,促进团队整体技术水平的提升。7、开展相关的技术研究和实验项目,为公司的技术储备和业务发展提供技术支持和决策依据。8、领导交办的其他工作。【资格要求】1、中华人民共和国国籍,且无国(境)外永久居留权(或长期居留许可),无海外婚姻关系。2、本科及以上学历,计算机、人工智能及机器学习等相关专业,具有3年及以上大模型开发或深度学习相关工作经验,有成功的大模型项目开发经验者优先。3、精通Python编程语言,熟悉常用的深度学习框架,如TensorFlow、PyTorch等。4、深入理解自然语言处理、深度学习、机器学习等领域的基本原理和算法,包括但不限于Transformer架构、注意力机制、生成对抗网络等。5、熟悉大模型的训练和优化方法,如分布式训练、量化、剪枝等,能够针对不同的业务场景和需求进行模型优化和调优。6、具备扎实的数据结构和算法基础,能够编写高效的代码实现复杂的算法和模型。7、熟悉Linux操作系统,掌握常用的命令和工具,能够进行服务器环境的配置和部署。8、具备良好的英文读写能力,能够阅读和理解英文技术文献和资料。