工作职责 RESPONSIBILITY1、数据采集与整合:负责制定数据采集计划,从各种数据源收集结构化和非结构化数据;对采集到的数据进行清洗、去重、转换和整合操作,将原始数据转化为可供分析和建模使用的高质量数据集。2、数据标注与审核:根据特定的 AI 任务,设计并执行详细的数据标注方案,对数据进行准确的标注;建立严格的数据标注质量审核机制,对标注结果进行抽样检查和审核。3、数据分析与洞察:运用统计学、数学分析和数据挖掘技术,对数据集进行深入分析,探索数据的分布特征等信息;通过数据可视化工具将分析结果以直观易懂的图表形式呈现给团队成员和业务。4、数据建模与特征工程:与模型开发工程师协作,参与数据建模过程,根据业务问题和数据特点选择合适的机器学习算法和模型;持续优化数据模型和特征工程方法,对数据特征进行调整和改进。任职条件 QUALIFICATIONS1、统招本科及以上学历,计算机科学、人工智能、机器学习、数据科学等相关专业。2、3年以上数据治理及开发经验,至少1年数据标注工程化经验等,参与过多个的数据类产品或项目,熟悉掌握多种数据开发技术和方法。3、掌握或熟悉数学与统计学基础、数据库与 SQL 知识、数据挖掘与机器学习理论、编程语言、数据结构与算法知识4、具备数据采集与清洗技能、数据标注与审核能力、数据分析与挖掘能力、特征工程与模型优化技能、数据质量监控与管理能力。