一、任职要求:1、三年以上软件开发工作经验,思路清晰,具有独立发现问题解决问题的能力 2、深入理解深度学习的基本原理,包括神经网络架构(如 CNN、RNN、Transformer 等)、反向传播算法、优化算法等 3、熟悉主流的 AI 大模型,如 ChatGPT、DeepSeek等系列等的架构、训练方法和应用场景,了解大模型的发展趋势和前沿研究成果 4、熟练掌握 Python 编程语言,熟悉 PyTorch、TensorFlow 等深度学习框架,能够使用这些框架进行模型的开发、训练和调优 5、具备独立进行 AI 大模型开发、微调、优化的能力 6、能够设计和实现与大模型应用相关的算法,如检索算法、融合算法等,以提升模型的应用效果 7、在模型训练和应用过程中,能够快速定位和解决出现的各种问题,如模型收敛问题、性能瓶颈问题等 8、具有 AI 大模型相关的项目经验或电力行业经验者优先 二、工作职责:1、根据产品建议书,编写需求分析、概要设计等文档 2、依据具体业务需求,选择合适的模型架构和参数,提高模型的性能和准确性 3、依据项目开发流程,在开发过程中承担软件工程师的职责 4、在实际开发过程中,与测试部、技术部、工程部进行沟通,实时调整业务功能 5、完成上级或公司安排的其他工作任务。