【岗位要求】1、统招本科学信网可查学历,理工科专业,2年以上开发经验;2、熟悉Python语言,结合pandas、Numpy等库进行数据清洗,转换,分析 3、熟悉数据提取、验证等扎实的编程基础,精通python,熟悉一种或多种深度学习框架(Pytorch/TensorFlow)作为加分项;4、熟悉 Linux 常用命令,掌握在 Linux 下搭建环境及开发部署测试,熟悉docker镜像操作和部署;5、在大模型、大数据、数据挖掘、图像处理等一个或多个领域有扎实的理论基础和丰富的实战经验优先;【工作职责】1、负责多模态大模型数据语料(图像、视频、文本、语音等)分析和处理,包括但不限于数据分布研究、数据获取、数据质量检测、海量数据去重、打标等,确保训练数据的有效性,可用性;2、负责优化和改进现有的数据清洗和质检打标流程,提高效率和准确性;3、负责大模型相关数据工具链的开发实现及应用维护等;