工作职责:1、深入了解工业企业的业务需求,带领数据团队进行数据集的规划和设计,为算法研发与模型训练提供高质量数据集支持;2、负责公司数据治理体系建设与管理,包括数据质量、数据标准、数据安全等相关制度流程的制定等;3、设计和构建高效的数据采集系统,实现从工业设备、传感器和系统中实时采集、清洗、预处理和传输数据,构建数据仓库与数据湖;4、负责设计数据存储架构,规划数据的存储方式、分布策略以及数据之间的关联关系,构建满足业务需求的数据库表结构、数据分区方案等;5、优化数据处理流程,制定并实施数据安全策略,确保数据系统符合行业法规;6、关注数据开发领域的前沿技术和发展趋势,结合工业数智化的实际需求,探索新技术在工业数据处理中的应用可能性,推动团队技术创新和能力提升。任职条件:02021、计算机、软件工程、数学等相关专业硕士或以上学历,如经验和能力特别优秀者可放宽;2、8年以上数据开发或数据工程经验,曾参与或承担过大数据的清洗、分析、挖掘、治理相关的科研或工程类项目,有工业领域相关经验者优先;3、掌握至少一种编程语言(如Python、Java、Scala等),掌握Linux环境下Hadoop、Spark框架的基本操作,能熟练运用SQL、MLlib组件,以及数据可视化工具;4、熟悉数据处理流程,掌握数据库管理系统与大数据处理框架,具备数据库设计、开发和优化能力;5、了解大模型对数据规模、质量的要求,掌握针对大模型的数据预处理优化策略;6、对业务流程有较强的理解能力,具备良好的问题解决能力和快速学习能力。