岗位职责: 1、负责包括文本语义识别、信息抽取、知识图谱等方面的算法研究; 2、利用NLP/ML/DL/数据挖掘等相关技术和算法,提供语义理解和文本生成的解决方案; 3、负责相关任务的方案调研和论证。4、负责标准相关文档的知识结构化,包括但不限于OCR、表格解析、公式解析等。5、负责处理微调大模型用到的相关数据,管理模型训练过程中的数据;6、负责垂直领域多模态大模型相关算法(预训练、微调、RLHF等)的预研、落地。7、了解图数据库的基本算法,结合RAG构建和优化私有化知识助手;8、熟悉智能推荐算法、线性规划算法者优先;岗位要求: 1、5年以上算法模型工作经验;2、计算机、数学、统计学等相关专业,有良好的数学基础及建模能力; 3、扎实的编程基础,至少熟练掌握Python/Java等一门编程语言; 4、熟悉垂域信息抽取、事件预测等相关技术,对常见格式如PDF、docx等文件中提取文字有应用开发经验优先; 5、具有LLM微调经验、多集群高并发部署经验;6、熟练掌握TensorFlow,PyTorch等机器学习框架中的一种及以上,了解Neo4j/DGraph/JanusGraph等图数据库;熟悉MySQL、OceanBase/MongoDB优先;对linux操作系统有使用经验和技术背景; 7、有钻研精神,主观能动性强,能适应快速变化的业务需求,具备良好的团队合作精神和沟通技巧;