岗位职责:1. 负责对海量文本数据进行建模分析 ,包括但不限于文本语义匹配 ,文本分类等等;2. 多模数据理解:对于文本/语言/图片/视频等原始语料进行结构化分析、理解 ,为大模型训练及业务场景提供数据基础;3. 数据策略调优:利用 Learning To Rank 等方法 ,搭建基础数据策路体系 ,以支撑业务场景。 任职要求1. 1-3年相关经验 ,计算机 , 电子或数学等相关专业本科及以上学历;2. 精通各种自然语言处理技术 ,如文本分析、信息提取、 问答系统、知识图谱等。精通各种NLP模型 和算法 ,包括Bert、xi net、CNN. RNN、 DNN、LSTM、Transformer等3. 对图像的数据处理有一定的了解 ,能够迅速对文本和图像进行一定的数据统计分析 ,能够利用已有模型 ,如 CLIP、 NSFW 进行数据清洗;4. 具有数据预处理、清洗、转换和标准化的技能 ,能够保证模型训练数据的质量和精确性。5. 具备出色的沟通技巧 ,能独立对接项目 ,拥有优秀的问题解决能力 、逻辑思维能力和学习能力 ,具 有强烈的职业操守和抗压能力。