职位描述● 参与公司机器学习平台建设、持续提升平台的稳定性、易用性和资源使用效率● 参与平台计算引擎的Operator的扩展开发● 参与公司AI 计算资源的管理、调度以及平台工具链开发任职要求● 本科以上学历,通信、电子、计算机相关专业毕业,工作经验三年以上者优先● 扎实的代码能力(C++/C、Go、Rust、Python等)以及良好的数据结构和算法基础● 熟悉机器学习平台的全流程开发并参与过机器学习平台开发,包括并不限于开发测试机、模型训练、模型管理、模型在线部署等● 熟悉K8S、yarn等常用的资源管理调度系统,对资源管理调度、资源利用率提升有比较深的理解且有相应工程经验者优先● 熟悉基于k8s的Operator开发,并具备多计算引擎Operator的开发能力者优先● 对kubeflow、argo等常用云原生开源软件熟悉优先