1.负责大数据平台的规划设计、环境搭建、技术架构、底层性能优化、问题修复等工作;2.负责数据相关业务应用场景的分析,利用数据相关技术实现对数据的采集、存储、分析与可视化;3.负责大数据平台的数据治理工作,包括但不限于元数据、数据标准、数据质量、数据安全等管理工作;4.负责系统的开发、测试、部署和维护。任职要求1.深刻了解分布式技术体系、基于开源Hadoop生态构建的大数据基础架构;2.掌握开源数据湖存储原理(Hudi、如Iceberg、Delta Lake、Paimon等),有规模化应用经验者优先;3.掌握HDFS、Flink、Spark、Kafka等大数据存储计算系统原理4.熟练使用SQL语言,掌握PostgreSQL、Greenplum、MySQL、Oracle等至少一种数据库(RDBMS/MPP)系统的使用,有较好的SQL性能调优经验;5.精通Java、Python、Scala等开发语言中的一种或多种,熟悉Linux操作系统和Shell编程;6.具有3年以上大数据平台、数据仓库、数据湖相关领域真实项目开发实施经验,有丰富的数据建模、ETL架构与开发经验,深入了解相关技术;7.有实时数据数据仓库、数据湖、湖仓一体真实项目开发实施经验者优先;8.全日制本科及以上学历,计算机软件、生物信息等相关专业,有合成生物行业IT系统开发经验者优先;9.扎实的独立分析问题、解决问题的能力,具有较强的学习能力、需求理解能力、沟通协调能力和团队合作精神。