岗位职责:1、负责设计和优化自然语言处理(NLP)、机器学习及大模型算法,针对医疗健康行业的应用场景,提升模型的准确性和效率,专注于医疗健康领域的特定任务,优化模型以满足高精度、低延迟的业务需求;2、参与数据采集、清洗、配比实验等工作,确保数据质量满足大模型的训练需求;3、开发并优化高效的算法模型,结合大数据量的处理能力,以支持大规模数据集上的训练和推理;4、跟踪大模型领域的前沿技术,如Transformer架构改进、高效训练算法、模型压缩与量化等,探索新技术在实际业务中的应用,推动算法创新与突破;5、将训练好的大模型部署到实际应用场景中,解决模型推理优化、资源管理等问题。任职要求:1、计算机、电子信息、数学等相关专业,硕士及以上学历,相关工作经验不少于3年;2、熟练掌握Python、PyTorch/TensorFlow等深度学习框架;熟悉Transformer架构及其变体;具备模型压缩、量化等优化经验。;3、熟悉多种大模型相关技术,包括但不限于:预训练、微调、RLHF等,了解主流模型(Qwen/LLaVA/Llama/GPT/DeepSeek等)的原理并有自己的理解; 4、熟悉(AutoGPT/AutoGen/MetaGPT等)Agent框架,有模型剪枝、蒸馏、量化等小型化技术研发经验优先; 5、有DeepSpeed、FSDP 等框架使用经验优先;具有良好的数学和算法理论基础,优秀的问题解决能力,能够独立解决复杂问题。