【深圳数据工程师职位招聘_深圳市万氪睿速科技有限公司招工招聘信息】-51米多多招聘网

主要职责：
1.为 Databricks 上的 ML 项目设计、开发和维护可扩展的数据管道。
2.使用 Databricks 的 Delta Lake 和 Spark SQL 实现 ETL 流程。
3.优化数据工作流程，实现高效的 ML 模型训练和部署。
4.与数据科学家合作，为 ML 模型准备和转换数据。
5.利用 Databricks 的 MLflow 进行 ML 实验跟踪和模型管理。
6.实施数据质量检查和监控解决方案。
7.利用 Databricks 的 Unity Catalog 进行数据发现和治理。
8.为 ML 特征存储和自动化特征工程的开发做出贡献。
9.协助将 ML 模型部署到生产环境。
10.指导初级数据工程师并推广***实践。

所需资格：
1.5 年以上数据工程经验，其中至少 2 年专注于 ML 项目。
2.对 Databricks 平台及其组件（Delta Lake、MLflow、Spark SQL）拥有丰富的专业知识。
3.精通 Python 和 SQL；具有 Scala 经验者优先。
4.熟悉 ML 工作流程和数据准备要求。
5.了解数据建模、数据仓库和维度建模概念。
6.具有版本控制系统（例如 GitlaB）和 CI/CD 管道的经验。
7.计算机科学、数据科学或相关领域的学士学位。

优先资格：
1.Databricks 认证（例如，Databricks 认证数据工程师助理）。
2.具有 Databricks 的 AutoML 和 Feature Store 功能经验。
3.了解实时数据流技术（例如 Kafka、Spark Streaming）。
4.熟悉容器化技术（Docker、Kubernetes）。
5.具有图形处理和分析经验。