为耐克中国数据湖设计和构建可重用的数据资产。 预测、识别和解决有关数据管理的问题,以提高数据质量。 清洁、准备和优化摄入和消费数据。 使用工作流调度工具实现复杂的自动化工作流和例程。 驱动由其他数据工程师执行的设计、代码、测试计划和数据集实现的协作审查,以支持维护数据工程标准。 解决复杂的数据问题,并执行根本原因分析,以主动解决产品和操作问题。 指导和发展其他数据工程师,以采用实践。 您将向工程经理汇报工作,您将与产品经理、其他工程团队成员以及各种有才华的耐克队友一起工作。您将成为团队的一员,该团队将推动您为耐克技术构建数据和分析解决方案。5~8年经验,在大数据平台上开发可扩展的数据湖/数据仓库。 学习Python编程是必须的。 对Spark SQL / Hive SQL语言有丰富的知识和经验,了解Presto或其他MPP数据库。 良好的机器学习知识将是伟大的优势。 在气流或其他数据仓库调度工具方面有良好的经验。 熟悉AWS S3、EMR、lambda和AWS组件或其他云计算上的类似技术堆栈。 在产品和工程领域之间建立积极关系的强大技能。 能够快速获取新的编程语言、技术和框架。 有在敏捷和Scrum开发过程中的工作经验。 流利的英语技能(包括口语和书面英语)