工作职责:1. 信息系统与项目管理: 主导核心系统及本地特色系统的建设、实施、运维(符合集团规划)。高效管理相关IT及算力项目,确保交付。2. 算力集群核心优化: 重点负责HPC/AI算力集群的日常监控、性能调优(作业调度/存储I/O/网络)、容量规划与效率提升。 管理集群软件栈(如Kubernetes/Slurm)。3. IT基础设施与安全: 全面管理(服务器/网络/存储/安全设备)及优化,确保高性能计算(HPC)/AI算力集群稳定运行。负责信息安全合规(等保三级、ISO 27001、NIST)及审计。4. 业务连续性: 制定执行BCP/DRP,重点保障算力集群高可用与快速恢复,管理备份容灾策略。5. 团队领导: 组建管理IT团队,提供技术指导(含算力平台技能),跨部门协作。任职资格:- 教育: 计算机/IT/相关本科+学历。- 经验 (必需): - 5-8年综合IT管理经验(覆盖IT基础、安全、系统、项目、团队)。 - 2+年HPC/AI算力集群实战优化经验:简历必须详述具体项目、集群规模、技术栈(如Slurm/K8s/Lustre/InfiniBand)及优化成果(如提升利用率XX%,缩短作业时间XX%)。- 核心技术知识 (可精通多项或具备相关落地项目管理经验): - 精通IT基础设施(服务器/存储/网络/虚拟化)。 - 精通主流安全框架(等保三级/ISO 27001/NIST)落地。 - 精通算力集群优化:架构(CPU/GPU)、作业调度、并行存储、高性能网络、性能监控与分析。- 核心技能 (必需): - 卓越的项目管理与团队领导力。 - 出色的沟通协调与问题解决能力。优先考虑:- 认证: CISSP, CISM, PMP, Kubernetes (CKA/CKAD), 云认证 (AWS/Azure/GCP)。- 行业: 医疗设备/生命科学(熟悉GxP/HIPAA/医疗等保)。