【岗位职责】1. 大模型研发与优化 - 负责大语言模型(LLM)的训练、微调及推理优化,提升模型效果与性能 - 探索模型压缩、加速技术(量化/蒸馏/稀疏化),降低推理成本 - 研究多模态大模型(文本、图像、视频)的融合与对齐技术 2. 应用落地 - 结合业务场景(如智能对话、代码生成、搜索推荐)设计大模型解决方案 - 优化模型部署,实现高并发、低延迟的线上服务 3. 前沿探索与创新 - 跟踪LLM、多模态、因果推理等前沿方向,主导技术预研并输出专利/顶会论文(CVPR/ICLR等)。 - 代表公司参与行业技术标准制定或开源社区贡献(如Apache项目Committer)。【任职要求】1.硕士及以上学历,计算机、人工智能相关专业 2.熟悉Transformer架构,有PyTorch框架深度使用经验 3.具备大模型训练/微调经验(如LLaMA、GPT、GLM等),熟悉DeepSpeed/FSDP等分布式训练框架 4.熟悉LangChain、LlamaIndex等应用开发框架者优先 5.在NLP/多模态领域有顶会论文或开源项目贡献者优先