技术能力:精通微服务架构、容器化技术(Kubernetes/Docker)、云原生开发(AWS/Azure),熟悉 AI 训练框架(TensorFlow/PyTorch)及高性能计算优化。 经验:5 年以上大型分布式系统架构经验,主导过云平台或 AI 基础设施设计,具备高并发、低延迟系统开发及 DevOps 全流程经验。 领域知识:熟悉 AI 训练资源调度、任务队列管理、模型生命周期管理,掌握分布式存储(HDFS/Ceph)与消息队列(Kafka/RabbitMQ)技术。 协作创新:擅长跨团队技术方案设计,推动云原生、边缘计算等前沿技术落地,具备复杂问题拆解与系统重构能力