工作职责:1.性能分析: 对 GPU 应用程序进行深入的性能分析,识别并解决性能瓶颈,包括内存访问模式、线程调度和执行效率;2.算法开发: 使用 CUDA、DirectX 或其他并行计算框架,开发和实现高效的 GPU 加速算法,以提升计算密集型任务的处理速度; 3.技术要求: 有与算法团队成员优化GPU,大幅提高训练或推理性能案例;4.技术趋势: 持续关注 GPU 技术和行业趋势,评估并整合新技术以提升系统性能;任职资格:1.教育背景: 计算机科学、电子工程或相关领域的硕士学位或博士; 2.工作经验: 3 年以上的 GPU 编程和性能优化经验,具有丰富的 CUDA 或 DirectX 开发背景;3.编程技能: 精通GPU编程常用的开发语言,具备深入的计算机体系结构和并行计算原理知识; 4.工具使用: 熟练使用 GPU 性能分析和调试工具,具有实际的性能优化案例和成果; 5.工作负载优化: 具备分析和调整各种 AI/HPC 工作负载性能的经验;有以下经验者优先: 1.HPC 研究经验: 具备高性能计算(HPC)领域的相关研究经验; 2.机器学习框架: 对 TensorFlow 或 PyTorch 等机器学习框架有深入的 GPU 优化经验; 3.AI 模型部署: 使用 Orin 或 Xavier 平台进行 AI 模型部署和优化,以及开发自动驾驶相关算法的实战经验;4.NVIDIA 经验: 具有 NVIDIA GPU 和 CUDA 编程的经验。