岗位职责:1.引领LLM技术在化学领域的创新应用:运用LLM、Agent/Multi-agent、RAG、RLHF等前沿技术,深入探索大模型与化学领域的融合路径,推动这些技术在业务中的高效落地与应用。2.优化文献数据结构识别算法:针对大规模文献数据,负责开发并优化相关算法,确保能够精准提取高质量语料及数据元信息,为LLM模型提供坚实的数据基础。3.全链条管理LLM训练流程:涵盖数据增强、分布式训练、推理加速优化及模型部署等关键环节,确保LLM模型的高效训练与部署。4.构建并强化LLM评测体系:负责建立全面的LLM评测体系,持续提升模型性能与能力。5.追踪前沿技术,推动业务创新:紧密跟踪AIGC领域及LLM技术的最新进展,探索Agent在复杂任务中的应用潜力,推动基于LLM的复杂任务在业务场景中的成功落地。6.研究并应用前沿技术优化AI模型:深入研究模型量化、算子优化、并行计算等多维度技术,为用户提供深度优化AI模型的支持,确保模型在NPU/GPU上实现高效运行。任职要求:1.教育背景与工作经验:硕士及以上学历,计算机科学、人工智能、自然语言处理、数学、统计学等相关专业背景,拥有10年以上算法开发经验。2.扎实的计算机基础与编程能力:具备深厚的计算机基础知识,精通C++/C/Python等主流编程语言,拥有大型软件库的开发经验。3.深度学习领域的深厚造诣:熟练使用Pytorch、Mindspore等深度学习框架,对机器学习/深度学习领域有深入的理解和研究,具备前沿算法研究经验、大语言模型训练和调优经验,能够指导并优化各类算法工作的开展。4.卓越的领导力与沟通能力:具有强烈的自我驱动力,具备优秀的团队领导能力和沟通协调能力,能够带领团队高效完成任务。5.优先考虑条件:(1)具备异构编程(CUDA、OpenCL等)及深度学习算法加速经验者优先;(2)有基于昇腾芯片构筑深度学习/机器学习算子加速库,开发、优化昇腾芯片算子经验者优先;(3)具备CV/NLP及图像算法开发经验,或多模态、语音模型开发经验者优先;(4)有开源大模型预训练和Finetune经验者优先。6.加分项:(1)拥有高关注度的机器学习相关博客或GitHub项目:能够展示您在机器学习领域的深厚积累与广泛影响力。(2)国际会议论文发表经历:在KDD、NeurIPS、ACL、EMNLP、IJCAI、AAAI、SIGIR等国际知名会议上发表过论文者,将作为重要的加分项。