工作内容:负责从各种数据源中获取数据,进行数据清洗、整理和转换,将其转化为适合于AI训练的数据格式,并协助训练数据的标注工作,保证数据的质量和有效性。主要职责:- 负责数据源的搜集、整理和分类,建立数据仓库,维护数据完整性。- 负责数据预处理,包括数据清洗、去重、格式转换等,确保数据质量。- 负责数据的标注工作,包括标注数据的类型、格式等,确保标注数据的完整性。- 协助AI模型的训练和调优,确保模型的稳定性和准确性。- 定期汇报数据开发进度,协助团队进行技术分享和交流。- 根据项目需求,负责数据驱动分析工作,输出报告。职位要求:- 本科或以上学历,计算机、数据科学等相关专业背景,熟悉数据结构、计算机网络、数据库等相关知识。- 熟练掌握Python等编程语言,具备一定的编程能力。- 熟悉常用的数据开发工具和AI框架,如Spark、PyTorch等。- 了解机器学习、深度学习的基本原理,具备一定的数学基础。