主要职责1. 根据公司实际业务情况,选择适合的开源模型并进行私有化部署和维护;2. 构建高效、可扩展的 AI 大模型架构,包括但不限于Transformer架构的变体等,以满足不同业务场景下的需求。3. 对模型压缩、量化、蒸馏等技术及模型参数的调优有研究和应用。4. 收集、梳理大规模数据,进行数据清洗和预处理,确保数据的质量和一致性,同时对数据进行标注和分类,为模型训练提供高质量的标注数据。运用数据分析和挖掘技术,从数据中提取有价值的信息和特征,为模型训练和优化提供支持。任职要求1. 计算机科学、信息技术、人工智能、数学、统计学等相关专业本科、硕士学历。2. 熟练掌握 Python、Java、C++ 等编程语言,具备良好的数据结构和算法基础。3. 了解TensorFlow、PyTorch 等深度学习框架,能够进行模型的训练和优化。4. 了解并应用多模态技术和框架结构以及其原理和应用场景。5. 对主流的Deepseek、Kimi、豆包、通义千问、智谱等大模型有深入研究和应用,对模型训练和微调经验。6. 了解和熟悉机器学习算法和深度学习模型;7. 掌握数据挖掘、数据清洗、数据预处理等技术,能够熟练使用SQL/Hive/Spark相关工具和算法对大规模数据进行处理和分析。8. 具备良好的团队合作精神,能够与不同背景的人员进行有效的沟通和协作。9. 具备较强的学习能力和问题解决能力,能够学习新技术和新知识,定位和解决模问题。