岗位职责:1、参与医疗行业通用大模型的开发与优化;2、参与医疗行业特定场景模型的定制优化与开发,支持医疗AI场景应用(如精准诊断、药物研发等);3、持续评估模型性能,进行参数调整和模型验证,提升模型的准确度与可用性;4、跟踪国内外AI技术发展,应用新技术提升产品性能。任职要求:1、计算机、电子信息、数学等相关专业,硕士及以上学历,相关工作经验不少于2年;2、具备良好的编程能力,精通Python编程,熟悉至少一种深度学习框架(如PyTorch),有较强的工程能力;3、熟悉多种大模型相关技术,包括但不限于:预训练、微调、RLHF等,了解主流模型(Qwen/LLaVA/Llama/GPT/DeepSeek等)的原理并有自己的理解; 4、熟悉(AutoGPT/AutoGen/MetaGPT等)Agent框架,有模型剪枝、蒸馏、量化等小型化技术研发经验优先; 5、有DeepSpeed、FSDP 等框架使用经验优先;具有良好的数学和算法理论基础,优秀的问题解决能力,能够独立解决复杂问题;6、良好的自我驱动能力和团队沟通/协作能力,能快速推进任务的完成。