岗位职责1、参与开发和建设Shopee的大规模AI基础设施,支持包括大模型在内的所有AI业务;2、参与开发和建设Shopee的AI平台,提供包括数据、训练、推理等端到端的AI平台能力;3、参与开发和优化Shopee大规模GPU算力集群的最优化的编排调度,提升算力集群的性能、稳定性和整体资源利用率;4、探索和落地业界前沿的AI相关技术,例如最新硬件架构、GPU优化技术、前沿AI分布式系统等,持续提升基础设施能力、降低算法使用成本。岗位要求1、2025届应届毕业生,本科及以上学历;2、优秀的编码能力,熟练掌握 Golang/C/C++/Python 至少一门语言;3、熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力;4、良好的学习能力,较强的团队沟通和协作能力,较强的自我驱动能力。加分项:1、熟悉Dokcer、Kubernetes、Kubeflow、Volcano、Ray等开源软件,有过使用和解决实际问题的经验;2、熟悉数据处理、模型训练、模型推理等,具有一定相关项目经验;3、熟悉PyTorch、Megatron、Deepspeed等机器学习框架;4、对GPU、RDMA和NCCL有一定了解。