职位描述:1、负责字节跳动旗下相关产品的大规模集群的SRE和运维优化工作;2、负责服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性和研发效率;3、负责大规模集群的云平台化、资源优化、SLA保障。职位要求:1、大规模系统的SRE或运维经验,熟悉linux、网络等系统运维的技能;2、对大规模分布式系统的设计,分析,故障排查有强烈兴趣;3、开发语言Python/Shell;4、有以下经验者优先:云平台相关经验(阿里云、AWS等)。