岗位职责:1.数据收集:负责从互联网等多种渠道收集和整合数据,确保数据的完整性和准确性。2.数据清洗:对收集到的数据进行清洗、预处理,提升数据质量。3.数据标注:根据项目需求,对数据进行有效的标注,确保数据的标注质量,为机器学习模型提供训练素材。4.算法测试:参与算法的测试和验证,评估算法的准确率和稳定性,为算法的优化和迭代提供数据支持。5.团队协作:与团队成员紧密合作,共享知识,解决数据处理过程中的复杂问题。任职要求:1.具备良好的沟通交流能力和不同类型业务知识的学习能力;2.对数据有极高的敏感度,注重细节,具备批判性思维能力。3.会使用SQL、Python等编程语言以及数据标注工具;会编写爬虫进行批量化数据采集;会使用提示词工程进行数据处理。4.了解数据清洗、预处理和标注流程,有数据集构建经验者优先。5.对数据结构、算法和机器学习有一定理解,具备算法测试和性能评估能力。6.具备良好的团队合作精神和沟通能力,能够独立解决问题。