岗位职责:1. 对生成式人工智能/多模态/预训练模型等相关算法及前沿技术进行预研和探索,在集成电路材料行业进行应用落地;2. 验证及应用各类开源AI分布式训练技术,进行分布式AI集群的架构设计、系统开发及优化;3. 使用生成式人工智能/生成对抗网络进行集成电路领域的数据集扩充,包括使用数据增强、数据合成、文本挖掘等策略获取数据并进行模型预训练;4. 与计算、实验团队紧密合作,完成项目可行性分析和模型方案设计,对模型部署环境进行监控和优化,确保项目与产品高效高质量交付。任职要求:1、 5年以上算法相关开发经验,具备生成式人工智能/通用人工智能开发部署、大模型轻量化、多机多卡大模型预训练经验者优先;2、具备扎实的机器学习/深度学习功底,有百亿级以上大模型分布式训练和部署经验,熟悉BERT/GPT/Transformer等当前热门模型;3、精通PyTorch/Tensorflow/Caffe等任意一种深度学习框架,并掌握DeepSpeed/Nvidia Megatron/Ray等分布式训练框架;4、拥有良好的编程能力,熟练掌握Python,掌握C++、数据结构和算法设计,熟悉Linux/Unix系统和Shell编程,熟练使用Git;5、熟悉分布式计算和云计算平台,拥有分布式训练框架相关项目背景,了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等相关知识;6、具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。