学历要求 硕士及以上学历; 专业要求 计算机、电子信息、人工智能等相关专业 主要职责 1、构建一个统一的数据存储格式及读取引擎,同时可以支持多个业务在不同场景(低成本/高可用性/高吞 吐/高性能/大容量/顺序或随机访问)的诉求; 2、针对大模型场景,构建高效的模型参数管理、切分、去重系统; 3、多级/分级存储的架构复杂度:不仅限于显存/内存/外存; 4、跟进前沿的软件/硬件架构演进与尝试; 5、多个子系统的多种目标的优化:训练部分的功能性、可用性、容错性;系统同步部分的数据一致性、实 效性、带宽容量; 6、针对一些索引/存储结构不断追求极致:诸如无锁化/渐进式数据结构的无限追求。 职位要求 1、熟练掌握Linux 环境下的C++/Python 编程语言的使用; 2、掌握分布式系统原理,参与过大规模分布式系统的设计、开发、维护和持续优化,能够识别大型复杂分 布式系统中的潜在问题; 3、参与过类似Parameter Server 系统优化,或者数据读取引擎的索引结构优化;或者有HDFS、PFS 等大型 分布式存储系统使用/优化经历; 4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分,良好的团队合作精神; 5、有强烈的工作责任心,较好的学习能力、沟通能力、自驱力和执行力; 6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。