职位描述:1.负责行业大模型的训练和微调,解决模型对文本、图片及语音等多种信息载体输入的理解与联合处理问题,提高大模型的训练效率及性能2.维护大规模的数据处理及分析流程,包括数据收集、数据清洗、数据结构化、数据自动合成、数据混合策略等技术方案3.与数据标注、infra工程等团队密切合作,共同优化数据、训练与评估流程4.负责对行业大模型项目的训练,微调,评测等***实践进行提炼,沉淀相应产品工具和能力5.主动跟踪最新的大模型领域研究,并能设计与实现算法原型进行验证0202任职要求1.计算机科学、人工智能或相关领域的本科及以上学历2.对机器学习、深度学习有深入的了解,尤其是在多模态学习领域3.熟悉Langchain, DeepSpeed, LlamaFctory, TensorRT-llm、Vllm、Ollama、LMStudio等框架4.熟练掌握Python语言、django框架,flask、FastAPI等web框架5.熟悉Linux使用管理,docker,02 git版本管理等工具6.具备较强的责任心和抗压能力,良好的团队工作精神,并能够独立解决问题7.具有较强的文献阅读能力和技术文档写作能力8.追求极致的模型表现,不满足于现状,有持续优化的热情