岗位职责:1、数据开发项目实施:负责全流程的数据开发项目,从需求调研阶段入手,与业务部门密切沟通,精准把握业务需求和目标,制定详细的数据开发计划。在开发过程中,结合 Hadoop、Spark 等大数据处理框架,完成数据采集、清洗、转换和加载(ETL)任务,确保数据的准确性和完整性。项目完成后,进行全面的测试和优化,保障数据开发成果稳定运行,满足业务实际应用需求。2、业务系统基础数据治理:针对企业内部各类业务系统,如财务系统、人力资源系统等,开展基础数据治理工作。对业务系统中的数据进行质量评估,识别数据缺失、错误、重复等问题,运用数据清洗技术和工具进行数据修复和优化。建立数据标准和规范,明确数据的定义、格式、编码规则等,确保各业务系统间数据的一致性和通用性,为企业数据的有效利用奠定基础。3、主数据的数据治理:承担主数据治理工作,梳理企业的主数据,如客户、供应商、产品等核心数据。通过数据整合和标准化处理,消除主数据在不同业务系统中的差异。制定主数据的管理流程和规范,包括数据的新增、修改、删除审批流程,确保主数据的准确性、***性和权威性,提升企业数据的整体质量和管理水平。4、数据仓库搭建:根据企业的数据战略和业务需求,设计并搭建数据仓库架构。选择合适的数据库管理系统,进行合理的存储规划。运用 ETL 工具将分散在各个业务系统中的数据抽取到数据仓库中,进行清洗、转换和加载,构建数据仓库的事实表和维度表,为数据分析和决策提供有力的数据支持。5、BI 可视化项目开发:参与 BI 可视化项目的开发,与数据分析师和业务用户紧密合作,了解他们的数据分析需求和可视化展示要求。使用 Tableau、PowerBI、帆软 等 BI 工具,将数据仓库中的数据进行可视化处理,以直观、易懂的方式呈现数据,帮助业务人员和管理层快速获取数据洞察,支持企业决策制定。6、完成领导交办的其他工作任务:积极响应领导安排的临时性、紧急性工作任务,如协助其他部门进行特定的数据查询和分析工作,参与企业数据安全相关的技术支持工作,根据企业战略调整和业务变化,及时完成领导交代的其他与数据开发和管理相关的工作事项,保障企业数据工作的顺利开展。任职资格:1、全日制本科及以上学历,计算机科学与技术、软件工程、数学、统计学、信息与计算科学、数据科学与大数据技术、人工智能、电子信息工程等相关专业;2、基础经验:拥有4年以上数据开发相关工作经验,完整参与过至少 3 个数据开发项目,熟悉数据开发全流程,从需求分析、设计、开发到测试、上线和维护,具备独立解决数据开发过程中常见问题的能力。3、项目经验:具有大数据项目开发经验,曾主导或深度参与基于 Hadoop、Spark 等大数据平台的数据处理项目,熟练使用 Hadoop、Spark、Flink 等大数据处理平台中的一种或多种,熟悉Doris、Clickhouse等主流大数据技术,有实际运用这些工具进行数据处理和分析的项目经验能够熟练运用这些平台进行大规模数据的存储、计算和分析,对大数据项目中的性能优化、任务调度等有实际操作经验。有数据仓库建设项目经验,熟悉数据仓库的架构设计、数据建模(如维度建模、实体关系建模)以及 ETL 流程开发,能够根据企业业务需求构建高效、稳定的数据仓库体系。4、技术运用经验:具备数据仓库建设与优化经验,熟悉数据仓库的架构设计、数据建模、ETL 流程开发者;具备数据可视化开发经验,能够使用 Tableau、PowerBI、帆软等工具(有帆软fcrp证书优先考虑)将数据转化为直观易懂的可视化报表;参与过大型企业数字化转型项目,在数据驱动业务决策方面有成功案例者优先。5、行业经验:有建筑行业国企重点业务领域的数据开发经验者优先考虑,熟悉相关行业的业务流程和数据特点,能够快速理解行业业务需求,并转化为有效的数据开发方案。在相关行业中,有过数据驱动业务决策、流程优化或产品创新的数据开发实践经验者更佳,能够展示如何通过数据开发为企业带来实际业务价值。6、数据库知识:精通 SQL 语言,无论是复杂的查询语句编写,还是对 SQL 语句进行性能优化,都能熟练应对,包括数据库设计、表结构创建、数据存储与检索等操作,同时了解数据库的事务处理、并发控制等机制。7、大数据技术体系:熟悉 Hadoop 生态系统,包括 HDFS(分布式文件系统)、MapReduce(分布式计算框架)、Hive(数据仓库工具)、HBase(分布式 NoSQL 数据库)等组件的原理与使用,能够运用这些组件进行大规模数据的存储、处理和分析。8、数据建模和ETL:理解数据建模的基本理论和方法,如维度建模、实体-关系(ER)建模等,能够根据业务需求进行数据仓库模型设计,包括事实表、维度表的构建,以及数据粒度的确定等。熟悉 ETL(Extract,Transform,Load)流程,掌握数据抽取、清洗、转换和加载的技术和工具,能够将分散在不同数据源的数据进行整合和处理,为数据分析和挖掘提供高质量的数据。9、分布式系统与云计算:了解分布式系统和云计算的基本原理和架构,包括分布式存储、分布式计算、分布式一致性等方面的知识,明白如何在分布式环境下进行数据处理和系统协同工作;10、数据语言:熟悉 Python 或 Java 编程语言,具备扎实的编程基础和数据结构知识。能够运用 Python 进行复杂的数据处理与分析任务,熟练使用 Pandas 进行数据清洗和预处理,借助 NumPy 实现高效的数值计算。11、业务理解能力:深入理解公司业务架构和运营模式,能够将业务需求转化为具体的数据开发任务,准确把握数据需求的核心要点,确保开发出的数据产品和服务能够有效支持业务决策和业务发展。善于挖掘业务数据背后的价值,主动与业务部门沟通协作,从数据角度为业务流程优化、产品创新、风险控制等提供有针对性的建议和方案,推动数据驱动的业务增长。12、沟通协作能力:具备良好的团队协作精神,能够与不同岗位的人员紧密合作,在跨部门项目中,积极分享技术经验和数据见解,共同完成项目目标。具备出色的沟通能力,无论是向上级汇报项目进展、向业务部门解释技术方案,还是与团队成员讨论技术细节,都能够清晰、准确地表达自己的观点和想法,确保信息的有效传递和理解。13、问题解决能力:在数据开发过程中,面对数据质量问题、系统性能瓶颈、技术选型困境等复杂难题,能够迅速定位问题根源,运用自身技术知识和经验,提出切实可行的解决方案,并有效执行,确保项目顺利推进。具备良好的故障排查能力,当数据处理流程出现异常或系统报错时,能够有条不紊地进行故障诊断,通过日志分析、数据比对等手段,快速找到问题所在,并及时修复,***程度减少对业务的影响。14、熟练使用WORD、EXCEL、PPT等办公软件;熟练掌握Linux 操作系统,熟悉常用命令和脚本编写;了解虚拟化技术和容器化技术,如Docker、Kubernetes等;熟悉计算机网络基础知识,具备一定的网络故障排查能力。15、持有大数据相关专业认证证书者优先。