岗位职责: 1、负责大型预训练模型的微调,以适应特定应用场景。 2、设计和实现高效的训练流程,优化模型性能。 3、开发自动化工具链,支持模型训练与评估。 4、管理和维护模型训练平台,确保其稳定性和高效性。 5、部署模型到生产环境,并进行监控和维护。 6、与其他团队协作,将AI能力集成到产品中。 7、持续关注前沿技术发展,探索新技术的应用。 任职资格: 1、计算机科学或相关领域的本科及以上学历。 2、熟悉主流大模型架构(如Transformer、BERT、GPT、T5等)及其变体。3、精通PyTorch、TensorFlow等深度学习框架,具备模型微调、蒸馏、量化等实践经验。4、熟悉经典视觉模型(如ResNet、YOLO、UNet、ViT等)及其应用场景。5、熟悉OpenCV、CUDA、TensorRT等工具,能够进行高效的视觉模型优化。6、对Prompt Engineering、Few-shot Learning、Reinforcement Learning from Human Feedback (RLHF)等技术有一定了解。